AI tạo sinh là gì?

Ghi nhận, AI tạo sinh (Generative AI) được xem là thế hệ tiếp theo của trí tuệ nhân tạo, chú trọng vào việc tạo ra nội dung, giải pháp hay là ý tưởng mới thay vì chủ phân tích dữ liệu như thời điểm hiện tại. Mô hình cơ bản đứng sau hoạt động của AI tạo sinh được gọi là mô hình ngôn ngữ lớn (Large Language Model hoặc LLM).

Đây chính là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện nhiều các tác vụ xử lý ngôn ngữ tự nhiên. Và một số mô hình phổ biến có thể kể đến như là GPT-4 do OpenAI phát triển, hoặc Bard của Google.

VinBigdata sắp cho ra mắt “ChatGPT phiên bản Việt 100%” cho người dùng cuối
Trong năm 2023, cú nổ ChatGPT đã làm rung chuyển thị trường công nghệ thế giới từ đó mở ra cuộc đua chinh phục trí tuệ nhân tạo (AI) tạo sinh giữa các quốc gia với ông lớn công nghệ. Nguồn ảnh: Internet

Chính vì thế, để có thể làm chủ AI tạo sinh hoàn toàn từ tầng lõi sâu nhất thì các doanh nghiệp cần xây dựng cũng như huấn luyện mô hình ngôn ngữ lớn từ những bước sơ khai. Chi tiết, ở giai đoạn nền tảng, mô hình có thể được đào tạo trên tập dữ liệu lớn để có thể ghi nhớ những quy luật cũng như cấu trúc ngôn ngữ. Cũng qua giai đoạn đào tạo, mô hình bắt đầu rút các mối quan hệ giữa các từ, cụm từ, câu và các khái niệm khác nhau, tiếp tục được tinh chỉnh qua nhiều bước để có thể tạo ra nền tảng phát triển các ứng dụng thực tế của AI tạo sinh.

Ứng dụng AI tạo sinh ở Việt Nam thực tế thế nào?

Đến thời điểm hiện tại, các đơn vị nghiên cứu và phát triển AI tạo sinh trên thế giới thường sẽ cung cấp sản phẩm theo một hình thức như mã nguồn mở (open source) và mã nguồn đóng (closed source) hay mã nguồn đóng tuy nhiên có sẵn qua API (APIs) và ứng dụng cho người dùng cuối (application).

Đối với các mã nguồn mở như là LLaMA (Meta), mô hình được công khai để cho các nhà phát triển cũng như cộng đồng có thể tải xuống sử dụng, chỉnh sửa và tùy biến. Trái lại, các mã nguồn đóng thường không công khai hoặc là cung cấp qua giao thức kết nối (APIs) như là GPT-4 (OpenAI) cho phép các doanh nghiệp tích hợp phần lõi công nghệ này vào sản phẩm riêng. Và ứng dụng như ChatGPT hay là Bard chính là sản phẩm được hoàn thiện cho người dùng cuối có thể dễ dàng trong việc truy cập, cài đặt cũng như sử dụng luôn những tác vụ cụ thể.

VinBigdata sắp cho ra mắt “ChatGPT phiên bản Việt 100%” cho người dùng cuối
Ghi nhận, AI tạo sinh (Generative AI) được xem là thế hệ tiếp theo của trí tuệ nhân tạo, chú trọng vào việc tạo ra nội dung, giải pháp hay là ý tưởng mới thay vì chủ phân tích dữ liệu như thời điểm hiện tại. Nguồn ảnh: Internet

Ở Việt Nam, có một số đơn vị đã cho ra mắt mô hình AI tạo sinh ở các định dạng khác nhau như là nền tảng FPT GenAI dành cho các doanh nghiệp, mô hình mã nguồn mở GPT và thời gian gần đây là Zalo AI LLM. Và tính đến thời điểm hiện tại, chưa có ứng dụng 100% made in Vietnam, cho người dùng cuối được chính thức công bố ở thị trường Việt Nam.

Theo nhiều nguồn tin cho biết, VinBigdata - đây là đơn vị thuộc Vingroup sẽ sớm cho ra mắt ứng dụng ViGPT. ViGPT là một ChatGPT phiên bản Việt dành cho người dùng cuối và doanh nghiệp, tập trung vào một số nội dung đặc thù của Việt Nam như văn hóa, địa lý, lịch sử, danh nhân,...

Cũng theo thông tin được chia sẻ thì người dùng có thể sử dụng phiên bản trải nghiệm giới hạn của ViGPT bằng tiếng Việt ở trên giao diện web - nó tương tự như ChatGPT.

Giám đốc Khoa học Công ty VinBigdata (Tập đoàn Vingroup) - Giáo sư Vũ Hà Văn cho biết: “Trên thế giới đã có một số tập đoàn nghiên cứu thành công và ra mắt các sản phẩm dựa trên mô hình ngôn ngữ lớn như OpenAI và ChatGPT hay Google với Bard. Còn ở Việt Nam, VinBigdata đã tiến hành xây dựng mồ hình ngôn ngữ lớn tiếng Việt, tập trung giải quyết ba vấn đề cốt lõi đó là cải thiện tính chính xác, giảm chi phí hạ tầng tính toán một cách tối đa, đảm bảo tính bảo mật”.

Nằm ở trong lộ trình xây dựng hệ sinh thái các sản phẩm ứng dụng AI tạo sinh quy mô lớn, dự kiến đến cuối tháng 12/2023, VinBigdata sẽ chính thức ra mắt cộng đồng hai dòng sản phẩm chính. Đó chính là nền tảng AI tạo sinh đa nhận thức VinBase 2.0 với những giải pháp phục vụ doanh nghiệp, cơ quan chính phủ cũng như ứng dụng ViGPT – “ChatGPT phiên bản Việt” sẽ chính thức được mở cho cộng đồng truy cập và thử nghiệm.

VinBigdata sắp cho ra mắt “ChatGPT phiên bản Việt 100%” cho người dùng cuối
Theo nhiều nguồn tin cho biết, VinBigdata (đây là đơn vị thuộc Vingroup sẽ sớm cho ra mắt ứng dụng ViGPT) - là là một ChatGPT phiên bản Việt dành cho người dùng cuối và doanh nghiệp, tập trung vào một số nội dung đặc thù của Việt Nam như văn hóa, địa lý, lịch sử, danh nhân,... Nguồn ảnh: Internet

Mới đây, Bộ Thông tin và Truyền thông cũng đã ban hành kế hoạch, đặt mục tiêu cho đến năm 2025 Việt Nam có ít nhất một nền tảng công nghệ LLM tiếng Việt. Kế hoạch cũng nhấn mạnh việc nghiên cứu, phát triển, đưa vào ứng dụng LLM tiếng Việt là một nhiệm vụ quan trọng và cần thiết cũng như rất ý nghĩa. LLM tiếng Việt sử dụng tri thức, dữ liệu đào tạo đã được sàng lọc của Việt Nam với mức chi phí thấp cho người dân, doanh nghiệp, tổ chức ở Việt Nam sử dụng để có thể phát triển những ứng dụng mới.

Có thể thấy, Việt Nam đang ở những bước đầu trên hành trình chinh phục AI tạo sinh, việc ra mắt các ứng dụng tương tự như ChatGPT của riêng người Việt đó là tín hiệu tốt cho thấy được những nỗ lực của các đơn vị công nghệ trong nước nhằm mục đích xóa bỏ sự phụ thuộc vào những sản phẩm quốc tế, từ đó đảm bảo được tính chính xác của thông tin, giảm thiểu dòng chảy dữ liệu ra thị trường nước ngoài.