AppleInsider cho biết, vào cuối năm nay, Apple hy vọng sẽ cung cấp tính năng sao chép và tóm tắt âm thanh theo thời gian thực trên toàn hệ thống trên nhiều thiết bị của mình, vì nhà sản xuất iPhone đang tìm cách khai thác sức mạnh của AI trong việc tăng cường hiệu quả cho một số ứng dụng cốt lõi của mình.
Những người quen thuộc với vấn đề này đã nói với chúng tôi rằng Apple đang nghiên cứu tính năng tóm tắt được hỗ trợ bởi AI và tăng cường đáng kể khả năng phiên âm âm thanh cho một số hệ điều hành thế hệ tiếp theo của họ. Các tính năng mới dự kiến sẽ mang lại những cải tiến đáng kể về hiệu quả cho người dùng Ghi chú, Bản ghi nhớ giọng nói và các ứng dụng khác.
Apple hiện đang thử nghiệm các khả năng bổ sung tính năng cho một số bản cập nhật ứng dụng dự kiến ra mắt cùng với việc phát hành iOS 18 vào cuối năm 2024. Họ cũng dự kiến sẽ tiến tới các ứng dụng tương ứng trong macOS 15 và iPadOS 18.
Ứng dụng Ghi nhớ giọng nói mặc định mà Apple đưa vào danh mục thiết bị của mình sẽ là một trong những ứng dụng đầu tiên nhận được các tính năng nâng cấp. Các phiên bản đầu tiên của ứng dụng cung cấp bản ghi đang chạy của từng bản ghi âm, hoạt động tương tự như tính năng Thư thoại trực tiếp gần đây của công ty.
Bản phiên âm chiếm khu vực trung tâm của cửa sổ ứng dụng, thay thế phần trình bày đồ họa lớn hơn của âm thanh đã ghi có trong phiên bản hiện có của ứng dụng.
Phiên âm cũng đang được đưa vào phiên bản tiếp theo của Ghi chú. Theo những người quen thuộc với phần mềm này, các phiên bản tiền phát hành của cả hai ứng dụng đều có nút phiên âm chuyên dụng ở dạng bong bóng lời thoại. Nhấn vào bong bóng lời nói mới sẽ hiển thị bản ghi âm thanh được ghi trong ứng dụng.
Công cụ phiên âm sẽ song hành với — và cung cấp bối cảnh mới cho — các tính năng ghi âm sắp ra mắt trong Ghi chú, được AppleInsider trình bày chi tiết lần đầu tiên vào tháng 4. Cụ thể, bản cập nhật sẽ thêm tùy chọn tóm tắt âm thanh đã ghi do AI tạo ra để cung cấp ngay bản tóm tắt văn bản cơ bản về các tiêu điểm chính và các mục hành động.
Tính năng tóm tắt AI, kết hợp với các tùy chọn ghi âm trong ứng dụng và sao chép thời gian thực mới, được kỳ vọng sẽ biến ứng dụng Ghi chú tích hợp của Apple trở thành một cỗ máy mạnh mẽ thực sự. Bộ ba tính năng này sẽ mang lại lợi ích cho nhiều ứng dụng thực tế, đảm nhận công việc nặng nhọc trong việc xử lý lượng lớn dữ liệu đến các tiêu điểm chính. Tất cả điều này mang lại sự thuận tiện và rõ ràng cho người dùng trong nháy mắt.
Học sinh có thể dễ dàng ghi lại các bài giảng và lớp học mà không cần dựa vào các công cụ của bên thứ ba. Nếu ghi từ ứng dụng Ghi chú mới, sẽ có tùy chọn bao gồm bản ghi và tóm tắt trong ghi chú, cùng với các phương tiện khác như hình ảnh, liên kết và cấu trúc dữ liệu như bảng.
Các tính năng này cũng sẽ mang lại lợi ích cho những chuyên gia thường xuyên tham gia các cuộc gọi hội nghị, cuộc họp kinh doanh ảo hoặc hội thảo như một phần công việc của họ. Những sự kiện như vậy thường tiết lộ lượng lớn thông tin, số liệu thống kê khác nhau, kế hoạch kinh doanh chi tiết, ngày tháng và lịch trình mà công nghệ AI của Apple sẽ phân tích và sắp xếp lại thành các bản tóm tắt có cấu trúc hợp lý.
Điều tương tự cũng áp dụng cho các lớp học hoặc bài giảng ở cấp độ nâng cao hơn thường bao gồm nhiều loại thông tin, chẳng hạn như định nghĩa, giải thích các ý tưởng phức tạp hoặc nguyên tắc lý thuyết, ví dụ minh họa, v.v.
Trong khi đó, các nhà báo sẽ có được một cách cực kỳ hiệu quả để ghi lại và tóm tắt các cuộc phỏng vấn dài. Những người sáng tạo như tác giả và nhà biên kịch có thể dễ dàng ghi lại các ý tưởng chính và xem qua chúng sau này mà không cần phải phát lại và nghe phần lớn bản ghi chỉ để tách biệt các điểm dữ liệu chính.
Mặc dù Apple đã nỗ lực hết sức để đảm bảo rằng các tính năng sao chép và tóm tắt của họ tạo ra kết quả chính xác nhưng vẫn không thể tránh khỏi những sai sót. Do đó, việc duy trì âm thanh gốc cùng với bản ghi và bản tóm tắt do AI tạo đảm bảo rằng không có thông tin nguồn nào bị mất trong quá trình sao chép hoặc tóm tắt.
Tóm tắt chỉ là một phần trong nỗ lực AI lớn hơn của Apple
Các tính năng sao chép và tóm tắt mới sẽ là một phần trong nỗ lực thúc đẩy AI rộng rãi hơn của Apple trong năm nay. Các tính năng tóm tắt tương tự cũng dự kiến sẽ xuất hiện trên Safari 18 thông qua Duyệt web thông minh và ứng dụng Tin nhắn tích hợp - thông qua tích hợp với phần mềm AI trên thiết bị của Apple .
Các trường hợp sử dụng và mục đích tổng thể của các tính năng tóm tắt do AI cung cấp trong Safari và Tin nhắn là hoàn toàn khác nhau. Trong khi Ghi chú sẽ cung cấp cho người dùng tùy chọn tóm tắt các cuộc họp, cuộc gọi hội nghị và bài giảng thì Safari sẽ cho phép tóm tắt trang web, trong khi Tin nhắn sẽ cung cấp phiên bản cô đọng của nội dung tin nhắn.
Phần mềm AI của Apple cũng có thể dùng để bảo vệ quyền riêng tư của người dùng vì một số tính năng AI nhất định dự kiến sẽ hoạt động hoàn toàn trên thiết bị. Tuy nhiên, trong trường hợp phiên âm âm thanh và tóm tắt AI nâng cao, việc xử lý phía máy chủ có thể được yêu cầu trong thời điểm hiện tại.
Bằng cách kết hợp tính năng tóm tắt và phiên âm âm thanh vào các ứng dụng hệ thống của mình, công ty mong muốn chứng minh một số lợi thế tốt nhất trong trường hợp sử dụng khi triển khai AI để giải quyết các tình huống trong thế giới thực. Mục tiêu trong nỗ lực AI của Apple là cung cấp các tính năng dành cho nhà phát triển hứa hẹn giúp khách hàng của mình hoạt động hiệu quả và thành công hơn trong các công việc hàng ngày.
Đồng thời, công ty đang hy vọng có được vị trí tốt hơn trước sự gia tăng của các ứng dụng cạnh tranh của bên thứ ba hiện đang sử dụng công nghệ AI, một số ứng dụng trong số đó đã có tỷ lệ chấp nhận tốt khi người tiêu dùng đưa chúng vào cuộc sống số của họ.
Ví dụ: ứng dụng Otter là một ứng dụng khác nhận được Giải thưởng Lựa chọn của Biên tập viên của Apple. Nó cung cấp chức năng tương tự như các tính năng được thảo luận trong bài viết này. Với nó, người dùng có thể ghi lại, phiên âm và tóm tắt các cuộc họp thông qua AI tổng hợp, tất cả trong một ứng dụng.
OneNote của Microsoft cũng cung cấp hỗ trợ ghi âm dưới dạng ghi chú giọng nói, đóng vai trò là đối thủ tiềm năng khác cho các ứng dụng Ghi chú và Ghi nhớ giọng nói của Apple.
Tuy nhiên, cần nhấn mạnh rằng không phải tất cả các tính năng phần mềm mà Apple thử nghiệm trong các bản dựng phần mềm trước khi phát hành đều được đưa vào chu kỳ phát hành hiện có. Apple được biết là đã hủy bỏ các dự án hoặc trì hoãn các tính năng đối với các bản phát hành hệ điều hành và ứng dụng tiếp theo vào phút cuối, vì vậy cuối cùng không có sự đảm bảo nào về thời gian và tính khả dụng.
Điều đó nói lên rằng, các tính năng tóm tắt AI và sao chép thời gian thực mới dường như vẫn đang trên đà ra mắt dự kiến cùng với các hệ điều hành thế hệ tiếp theo của Apple tại Hội nghị các nhà phát triển toàn cầu ( WWDC ) của công ty vào tháng 6. Họ dự kiến sẽ được tham gia bởi các ứng dụng Lịch và Máy tính được cải tiến cùng với các ứng dụng khác.