Cảm hứng:

Vào sáng sớm ngày 14 tháng 5 năm 2024, OpenAI đã tổ chức "Ra mắt sản phẩm mới mùa xuân" đầu tiên. Họ đã ra mắt một sản phẩm chủ lực mới - mẫu máy tính để bàn và mẫu thế hệ GPT-4o, đồng thời trình diễn một số tính năng mới.

Hội nghị này thật bất thường vì công nghệ của OpenAI thay đổi hình thức sản phẩm mà chúng ta quen thuộc và truyền tải một thông điệp quan trọng đến các công ty công nghệ toàn cầu.

Trong khi các hãng công nghệ khác vẫn đang bắt kịp các mô hình lớn và chức năng đa phương thức, cố gắng tích hợp văn bản tóm tắt, chỉnh sửa hình ảnh và các chức năng khác vào ứng dụng di động thì OpenAI đã trực tiếp tạo nên một làn sóng cách mạng công nghệ cực lớn. Các sản phẩm họ sắp phát hành có cảm giác như bước ra từ một bộ phim khoa học viễn tưởng, với Ultraman Sam khiến họ phải kinh ngạc!

Nhập văn bản: 👇

Giám đốc kỹ thuật OpenAI Mira Murati bày tỏ ba điều quan trọng:

●Đầu tiên, cô thông báo rằng các sản phẩm trong tương lai của OpenAI sẽ ưu tiên sử dụng miễn phí để nhiều người có thể hưởng lợi hơn.

●Thứ hai, để đạt được mục tiêu này, OpenAI đã phát hành phiên bản máy tính để bàn của chương trình và giao diện người dùng (UI) cập nhật giúp sử dụng các công cụ này dễ dàng và tự nhiên hơn.

●Cuối cùng, sau khi Mira công bố GPT-4, OpenAI đã tung ra phiên bản mới của mẫu lớn có tên GPT-4o. Điều đặc biệt ở mẫu mới này là nó tương tác với người dùng một cách cực kỳ tự nhiên, mang lại trí thông minh tương đương với GPT-4 cho mọi người và ngay cả những người dùng miễn phí cũng có thể tận hưởng mức độ dịch vụ này.

Sau bản cập nhật ChatGPT này, mô hình lớn có thể nhận bất kỳ sự kết hợp nào giữa văn bản, âm thanh và hình ảnh làm đầu vào và tạo ra bất kỳ sự kết hợp nào giữa văn bản, âm thanh và hình ảnh đầu ra trong thời gian thực—đây là phương thức tương tác của tương lai.

Bốn điểm nổi bật của GPT-4o:

Điểm nổi bật 1: Đối thoại thực tế + lời giải toán học

Tốc độ phản hồi của GPT-4o khá nhanh, trung bình chỉ 320 mili giây và nhanh nhất nó có thể trả lời câu hỏi của bạn chỉ trong 232 mili giây, tương đương với tốc độ trò chuyện của con người. Điều này có nghĩa là khi nói chuyện với GPT-4o, bạn không phải đợi quá lâu để nhận được câu trả lời ngay lập tức. Hơn nữa, sau khi tốc độ phản hồi của GPT-4o trở nên nhanh hơn, khả năng tương tác của nó với bạn sẽ trở nên tự nhiên hơn, giống như đang trò chuyện với người thật! Nó thậm chí có thể bắt chước giọng điệu của robot, kể cho bạn nghe những câu chuyện trước khi đi ngủ và thậm chí là hát!

Không chỉ vậy, GPT-4o còn cải tiến công nghệ trực quan hóa thông qua camera, có thể giúp bạn giải các bài toán theo từng bước! Điều này có nghĩa là việc học toán trở nên thú vị và dễ hiểu hơn.

Điểm nổi bật 2: Kỷ nguyên mới của giao tiếp thông minh

Lần này, công nghệ giọng nói của GPT-4o đã được cải tiến không chỉ ở tốc độ phản hồi và khả năng nhận biết cảm xúc mà còn ở chức năng dịch ngôn ngữ theo thời gian thực. Tại cuộc họp báo, họ lần lượt nói bằng tiếng Ý và tiếng Anh. GPT-4o sau đó có thể dịch nhanh cuộc trò chuyện của họ sang ngôn ngữ của người khác, thể hiện khả năng dịch nhanh chóng mạnh mẽ của nó.

Điểm nổi bật 3: Kỷ nguyên mới của cảm biến thông minh về cảm xúc người dùng

Trước đây, các mẫu như GPT-3.5 và GPT-4 được xây dựng từ ba phần riêng biệt chịu trách nhiệm chuyển đổi âm thanh thành văn bản, xử lý văn bản và sau đó chuyển đổi văn bản thành âm thanh. Quá trình này hơi phức tạp và thiết kế này ngăn GPT nắm bắt chính xác các chi tiết như giai điệu và cảm xúc.

Tuy nhiên, OpenAI đã có những điều chỉnh đặc biệt trên mẫu GPT-4o. Giờ đây, cả đầu vào và đầu ra đều được xử lý bởi cùng một mạng lưới thần kinh, cho phép cảm nhận tốt hơn cảm xúc của người dùng. Ngay cả khi cuộc trò chuyện bị gián đoạn, GPT-4o có thể nhanh chóng tiếp tục và tiếp tục cuộc trò chuyện.

Điểm nổi bật 4: Miễn phí cho tất cả người dùng

Mẫu GPT-4o sẽ được mở miễn phí cho tất cả người dùng, trong khi giới hạn dung lượng cho người dùng trả phí sẽ tăng gấp 5 lần. Phiên bản alpha sắp tới của GPT-4o sẽ bao gồm chế độ giọng nói mới cho người dùng ChatGPT Plus. "GPT Store", trước đây chỉ dành cho người dùng ChatGPT Plus, giờ đây đã miễn phí và mở cửa cho tất cả người dùng. Ngoài ra, người dùng Mac hiện có thể sử dụng phiên bản dành cho máy tính để bàn của Ứng dụng ChatGPT, trong khi phiên bản dành cho người dùng Windows cũng sẽ được ra mắt trong năm nay.

Những bản cập nhật này có nghĩa là nhiều người hơn có thể tận hưởng các chức năng mạnh mẽ của GPT-4o và "GPT Store" miễn phí và mở cũng cung cấp cho người dùng nhiều sự lựa chọn hơn.

Về những gì sắp xảy ra với OpenAI:

Ngoài việc giới thiệu mô hình mới, OpenAI còn tiết lộ chiến lược kinh doanh của mình tại buổi họp báo.

Đầu tiên, họ tuyên bố rằng chi phí truy vấn của mô hình mới thấp hơn 50% so với GPT-4, điều đó có nghĩa là họ có khả năng cung cấp mô hình mới cho tất cả người dùng. Điều này cho thấy OpenAI tập trung hơn vào việc thu hút số lượng lớn người dùng hơn là thu hút nhiều người trả tiền để đăng ký.

Số lượng người dùng lớn là một tin vui đối với cửa hàng GPT, vốn đã trực tuyến được vài tháng. Cũng giống như cửa hàng iOS, OpenAI hy vọng cộng đồng người sáng tạo và nhà phát triển có thể cùng nhau thúc đẩy sự phát triển của cửa hàng GPT.

Ví dụ: một số giáo sư có thể sử dụng GPT để thiết kế nội dung tùy chỉnh cho các lớp học hoặc người tạo podcast có thể tạo nội dung GPT độc quyền cho người nghe. Tất nhiên, một số nhà công nghệ cũng tin rằng nhiều công cụ hữu ích được cung cấp bởi GPT-4o sẽ xuất hiện trên điện thoại thông minh trong tương lai.

Apple hiện đang tìm kiếm đối tác bên thứ ba về vấn đề này và các đối tác đàm phán bao gồm Google và OpenAI.

OpenAI cần gì nhất? Chỉ Apple mới có thể cung cấp quyền ứng dụng phía thiết bị và quyền cấp hệ thống.

Apple cần gì nhất? Công nghệ AI tốt nhất và mô hình ngôn ngữ lớn phù hợp nhất, GPT-4o chắc chắn là ứng cử viên sáng giá nhất.

Hơn nữa, Apple có lợi thế riêng về chip tự phát triển và hệ sinh thái khép kín. Khi viết bài này, tôi thậm chí còn bắt đầu mong chờ hội nghị WWDC sắp tới của Apple vào ngày 10 tháng 6.

kết thúc:

Trong lĩnh vực trí tuệ nhân tạo, mọi tiến bộ công nghệ đều thể hiện sự tích hợp sâu sắc hơn giữa trí tuệ con người và trí tuệ máy móc. Là mẫu hàng đầu mới nhất của OpenAI, GPT-4o đã đạt được tiến bộ vượt bậc về công nghệ. Nó bổ sung thêm khả năng hiểu âm thanh và chú ý hơn đến trải nghiệm người dùng, giúp việc tương tác trở nên tự nhiên và thuận tiện hơn.

Mặc dù OpenAI vẫn đứng trước nhiều cơ hội và thách thức nhưng công ty vẫn giữ vững niềm tin và không ngừng đổi mới. Trong lĩnh vực trí tuệ nhân tạo trong tương lai, OpenAI sẽ tiếp tục đóng vai trò dẫn đầu và đóng góp nhiều hơn cho sự tiến bộ của xã hội loài người.