Sử dụng các ứng dụng giọng nói để tìm đường, ghi chú, đặt lệnh mua bán hàng hóa, bật tắt đèn… đang trở thành thói quen của nhiều người, đặc biệt là giới trẻ.
Nghiên cứu của Google cho thấy, 55% người dùng dưới 18 tuổi tại Mỹ thường dùng các "trợ lý ảo" như Cortana, Siri hay Google Voice Search hơn một lần mỗi ngày. Còn Forrester Research cũng đã khảo sát 1.168 người và nhận thấy một lượng lớn người dùng đã sử dụng công nghệ này để gửi tin nhắn, 46% dùng cho việc tìm kiếm, 40% tìm đường và 38% để ghi chú.
Công nghệ giọng nói cũng đang được các nhà cung cấp dịch vụ OTT như Viber, WhatsApp tích hợp và phát triển mạnh trong ứng dụng chat, nhắn tin. Đặc biệt, một số phần mềm OTT còn được đầu tư công nghệ truyền tải và lọc âm sao cho tin nhắn thoại của người dùng được gửi đi nhanh nhất và nhận được âm thanh trong trẻo, chân thực nhất. Mới đây, Google cũng triển khai tính năng thực hiện lệnh giọng nói để nhắn tin sang các ứng dụng OTT như WhatsApp, WeChat, NextPlus, Telegram, Viber...
Tại Việt Nam, xu hướng ứng dụng công nghệ giọng nói đang được nhiều doanh nghiệp quan tâm và phát triển. Tháng 8/2015, sàn thương mại điện tử Sendo.vn đã giới thiệu ứng dụng mua sắm trên điện thoại. Thay vì gõ từ khóa, người mua có thể sử dụng giọng nói để tra cứu sản phẩm cần tìm trên SendoApp. Chẳng hạn, khách hàng chỉ cần đọc từ khóa, như "đầm công sở", ứng dụng sẽ trả về các kết quả tương đương với kiểu nhập từ khóa trên bàn phím.
Công ty Bkav cũng đã trang bị công nghệ "trợ lý ảo" trong mô hình nhà thông minh SmartHome của mình. Theo đó, người dùng có thể điều khiển các thiết bị trong nhà như bật tắt đèn, điều hòa, ti vi, kéo rèm cửa… bằng giọng nói.
Từ đầu năm 2015, nhóm phát triển Robot thuộc Viện nghiên cứu Công nghệ FPT bắt đầu thử nghiệm ứng dụng giọng nói vào robot. Sản phẩm có tên Rogo cho phép dùng giọng nói để giao tiếp, điều khiển thiết bị trong gia đình, chụp ảnh, telepresence… Ngoài Rogo, Ban công nghệ FPT cũng nghiên cứu một số ứng dụng như thuyết minh phim (từ phụ để chuyển sang giọng nói).
Theo ông Nguyễn Ngọc Minh, Phó ban Công nghệ FPT, trong tương lai, việc ứng dụng công nghệ chuyển từ text sang giọng nói sẽ hỗ trợ rất nhiều trong các hoạt động của con người như giúp người già đọc báo, đọc tin nhắn khi lái xe…
Trước mắt, sản phẩm Rogo sẽ được dùng để hỗ trợ cho việc phát triển ứng dụng công nghệ điều khiển giọng nói trong cuộc thi S.M.A.C Challenge 2015. Đây là cuộc thi đầu tiên tại Việt Nam tìm kiếm và phát triển các ứng dụng tương tác bằng giọng nói, dành cho những người tuổi từ 18-30. FPT kỳ vọng thông qua cuộc thi sẽ tìm kiếm được những ý tưởng có giá trị xã hội cao để đầu tư, phát triển, đưa vào ứng dụng trong thực tế.
Các chuyên gia công nghệ nhận định, cùng với sự phát triển của các thiết bị IoT (Internet of Things), xu hướng sử dụng phần mềm điều khiển bằng giọng nói sẽ được áp dụng nhiều hơn nữa trong tương lai./.
Theo VnExpress