GPT-4o có thể hỗ trợ cả thợ sửa ống nước nhưng không phải 'kẻ hủy diệt' nhân viên máy tính

15/5/2024 Gốc

GPT-4o, mô hình trí tuệ nhân tạo (AI) đa phương thức mới nhất của OpenAI, và các sản phẩm tương tự có thể cách mạng hóa hoàn toàn môi trường làm việc.

GPT-4o có khả năng trò chuyện bằng giọng nói theo thời gian thực, tương tác với văn bản và hình ảnh. Công nghệ này đại diện cho một bước tiến lớn về AI trong thời gian gần đây.

OpenAI đã giới thiệu GPT-4o trong hàng loạt video rạng sáng 14.5 giờ Việt Nam, cho thấy khả năng thị giác và giọng nói được cải thiện của công nghệ. GPT-4o khiến nhiều người ngạc nhiên nhưng cũng nhận không ít lời chế giễu, với việc Sam Altman – Giám đốc điều hành OpenAI ngầm so sánh nó với trợ lý AI trong bộ phim khoa học viễn tưởng Her năm 2013. Trong khi Elon Musk nói màn trình diễn GPT-4o của OpenAI khiến ông "rùng mình". Tỷ phú công nghệ bình luận trên một số bài đăng chế nhạo GPT-4o trên mạng xã hội X của mình, trong đó có nội dung cho rằng OpenAI đã biến ChatGPT thành bạn gái AI.

Dù còn quá sớm để dự đoán chính xác GPT-4o và các mô hình AI đa phương thức khác sẽ ảnh hưởng đến lực lượng lao động như thế nào, chắc chắn chúng sẽ thay đổi cách con người làm việc, theo Maribel Lopez, nhà phân tích AI sáng lập công ty tư vấn nghiên cứu và chiến lược Lopez Research.

"Mô hình AI đa phương thức sẽ tác động đến nhiều ngành công nghiệp khác nhau vì nó có thể xử lý văn bản, video và âm thanh", Maribel Lopez nói với trang Insider. Thế nhưng, không phải tất cả những tác động đó đều là tiêu cực, bà nói. Ví dụ, thợ điện, thợ sửa ống nước cùng các nhân viên khác dùng tay và cảm giác có thể sử dụng mô hình AI đa phương thức để làm cho công việc của họ dễ dàng hơn, theo Maribel Lopez.

"Với những nhân viên sửa chữa thiết bị chuyên dụng, AI có thể rất hữu ích trong việc khắc phục sự cố hoặc sửa chữa các vấn đề. Tuy nhiên, AI sẽ không thay thế những nhân viên này vì họ phải có mặt để thực hiện công việc", Maribel Lopez lý giải.

Theo Maribel Lopez, thợ điện và thợ sửa ống nước có thể sử dụng mô hình AI đa phương thức như GPT-4o để làm cho công việc của họ dễ dàng hơn - Ảnh: Internet

Trong khi một số công ty đang nghiên cứu robot AI có thể làm việc vật lý, chúng thường phù hợp hơn với các nhiệm vụ lặp đi lặp lại cơ bản như hàn bu lông hơn là công việc chân tay phức tạp.

Tuy nhiên, các ngành công nghiệp khác có thể gặp nhiều thách thức hơn trong việc thích ứng với việc triển khai mô hình AI đa phương thức tại nơi làm việc.

"AI sẽ tác động đến bất kỳ công việc nào có dữ liệu", Maribel Lopez nói, chỉ ra các ngành như chuỗi cung ứng và tài chính.

Theo Maribel Lopez, ước tính chung là từ 20% đến 30% nhiệm vụ do nhân viên ngồi máy tính thực hiện cuối cùng sẽ bị AI thay thế. Song, điều đó không có nghĩa là nhân viên máy tính sẽ thất nghiệp.

Lấy ví dụ như trợ lý pháp lý, Maribel Lopez cho biết công việc của họ có thể chuyển từ theo dõi tài liệu và viết tóm tắt (nhiệm vụ có thể khiến một người mất hàng giờ nhưng AI hoàn thành trong vài phút) sang các công việc khác chưa được biết đến.

"Thách thức từ AI là buộc tất cả chúng ta phải nâng cao kỹ năng của mình. Đó sẽ là một sự thay đổi cho chúng ta", Maribel Lopez cho hay.

Có vẻ OpenAI cũng không muốn GPT-4o trở thành "kẻ hủy diệt" nhân viên máy tính. Công ty đã giới thiệu video cho thấy GPT-4o hoạt động như trợ lý cá nhân, đề xuất thay đổi mã lập trình theo thời gian thực và cung cấp tóm tắt văn bản chỉ trong một câu.

GPT-4o khiến ChatGPT trở nên giống con người hơn

GPT-4o giúp ChatGPT trở nên giống con người hơn và khiến các đối thủ phải lo lắng.

Hôm 10.5, Sam Altman, Giám đốc điều hành OpenAI, từng tiết lộ rằng bản cập nhật ChatGPT "giống như phép thuật" và ông không sai.

Trình làng GPT-4o có khả năng trò chuyện bằng giọng nói rạng sáng 14.5, OpenAI như gửi lời tuyên chiến đến các đối thủ lớn trong lĩnh vực công nghệ: Đến lượt các bạn!

Mira Murati, Giám đốc Công nghệ của OpenAI, đã giới thiệu bản cập nhật mùa xuân cho ChatGPT với hàng loạt màn trình diễn trực tiếp ấn tượng. Được hỗ trợ bởi GPT-4o, phiên bản ChatGPT mới có thể suy luận qua âm thanh, hình ảnh và văn bản trong thời gian thực.

Mira Murati cho biết GPT-4o “tốt hơn nhiều so với bất kỳ mô hình AI hiện có nào trong việc hiểu và thảo luận về những hình ảnh mà người dùng chia sẻ”.

Nhờ GPT-4o, người dùng có thể nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như ngắt lời ChatGPT khi chatbot này đang nói. Không những thế, ChatGPT có khả năng biểu đạt cảm xúc và thay đổi giọng điệu.

“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên với tôi; bây giờ thì có”, Sam Altman viết trong một bài đăng trên blog.

Trong bản demo được OpenAI trình diễn, ChatGPT nói giọng nữ diễn viên Scarlett Johansson (Mỹ) trong phim Her, nhưng các nhà nghiên cứu của OpenAI chuyển sang giọng robot tại một số thời điểm. Một người phát ngôn OpenAI cho biết đầu ra âm thanh của ChatGPT sẽ bị giới hạn trong một số giọng nói nhất định.

Sau màn trình diễn GPT-4o, Sam Altman đã đăng một từ her (cô ấy) trên tài khoản mạng xã hội X, ám chỉ đến bộ phim cùng tên do Spike Jones làm đạo diễn, kể về người đàn ông yêu trợ lý AI của mình, với Scarlett Johansson lồng tiếng.

ChatGPT không chỉ nói giống con người mà còn thể hiện khả năng bắt chước cách nói của chúng ta một cách đáng kinh ngạc. ChatGPT cười khúc khích, biết pha trò và điều chỉnh ngữ điệu giọng nói tùy thuộc vào lời nhắc.

Nó dường như cũng có khả năng nắm bắt một số tín hiệu của con người. Trong khi một nhà nghiên cứu OpenAI đang thở dốc lúc hít thở sâu, ChatGPT nói: "Mark, bạn không phải là máy hút bụi".

Người dùng cũng có thể ngắt lời ChatGPT, điều này làm cho cuộc trò chuyện cảm thấy tự nhiên hơn. Bạn không phải chờ chabtot AI kết thúc câu trả lời trước khi hỏi câu khác hoặc thay đổi chủ đề.

Thời gian ChatGPT phản hồi cũng nhanh chóng. Người phát ngôn của OpenAI cho biết phiên bản ChatGPT mới có thể phản hồi các đầu vào âm thanh với tốc độ tương tự con người, mất trung bình 320 mili giây.

ChatGPT được nâng cấp về thị giác

ChatGPT đã thể hiện khả năng nâng cao để diễn giải đồ thị, viết mã lập trình, thể hiện cảm xúc và hướng dẫn người dùng về các phương trình toán học bằng cách xem video, hình ảnh được chiếu từ camera của smartphone.

Trong suốt quá trình đó, ChatGPT duy trì giọng điệu vui vẻ và vui tươi.

Trong một bản demo được chia sẻ trực tuyến, GPT-4o có thể phân tích video về không gian xung quanh một người dùng, nhận ra rằng người đó đang mặc áo hoodie của OpenAI và được bao quanh bởi thiết bị ghi hình…

Dù ChatGPT đôi khi gặp vài trục trặc, chẳng hạn diễn giải sai một yêu cầu về hình ảnh hoặc trả lời không chính xác trước khi câu hỏi hoàn thành, những khoảnh khắc này gần như làm cho chatbot AI trở nên giống con người hơn.

Tất cả điều này giúp ChatGPT vượt trội những gì chúng ta thấy từ các đối thủ của OpenAI.

Trong một trường hợp, ChatGPT bắt đầu trả lời một yêu cầu trước khi nhà nghiên cứu OpenAI chiếu phương trình lên camera. Nhà nghiên cứu này đã dừng chatbot lại.

"Ồ, tôi quá phấn khích. Tôi sẵn sàng khi bạn sẵn sàng", ChatGPT trả lời.

Nó dường như trả lời bằng các phản hồi như có cảm giác biết ơn. Khi nhà nghiên cứu chiếu cho chatbot AI này xem một bức ảnh viết rằng "Tôi yêu ChatGPT", nó trả lời "aw" và nói "thật ngọt ngào". Aw thể hiện niềm vui hay sự yêu mến, đặc biệt là khi phản ứng trước một cái gì đó được xem là ngọt ngào hay đáng yêu.

Trong một trường hợp khác, nhà nghiên cứu OpenAI nói rằng có tâm trạng rất vui vì đang chứng tỏ “bạn hữu ích và tuyệt vời như thế nào” thì ChatGPT phản hồi: "Ồ dừng lại đi! Anh đang làm tôi đỏ mặt!".

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/gpt-4o-co-the-ho-tro-ca-tho-sua-ong-nuoc-nhung-khong-phai-ke-huy-diet-nhan-vien-may-tinh-217277.html