Tri thức & Tin tức

Khám phá Công nghệ
& Sáng tạo

Nơi chia sẻ những nghiên cứu mới nhất, kinh nghiệm kỹ thuật và các tin tức sự kiện từ cộng đồng SIU AI Lab.

Sinh viên SIU tham gia Hội nghị Quốc tế SOICT 2025 tại Nha Trang
Conference
19 - 12 - 2025 Tin mới nhất

Sinh viên SIU tham gia Hội nghị Quốc tế SOICT 2025 tại Nha Trang

Trong tháng 12/2025, sinh viên Trường Đại học Quốc tế Sài Gòn (SIU) đã tham gia và trình bày các công trình nghiên cứu tại SOICT 2025 – The 14th International Symposium on Information and Communication Technology, hội nghị khoa học quốc tế uy tín trong lĩnh vực Công nghệ Thông tin và Truyền thông, được tổ chức tại thành phố Nha Trang.

Tất cả bài viết

Cache-Augmented Generation là gì và nó có tốt hơn RAG?
AI 13 - 04 - 2025

Cache-Augmented Generation là gì và nó có tốt hơn RAG?

​Retrieval-Augmented Generation (RAG) là một phương pháp phổ biến trong lĩnh vực trí tuệ nhân tạo, đặc biệt trong việc tăng cường khả năng của các mô hình ngôn ngữ lớn (LLMs) bằng cách truy xuất thông tin từ các nguồn dữ liệu bên ngoài để tạo ra câu trả lời chính xác và cập nhật hơn. Tuy nhiên, RAG không phải là giải pháp duy nhất và hoàn hảo cho mọi tình huống. ​ Độ phức tạp hệ thống: Việc triển khai RAG đòi hỏi xây dựng và duy trì các hệ thống truy xuất, cơ sở dữ liệu vector, và pipeline tích hợp giữa các thành phần. Điều này làm tăng độ phức tạp và chi phí vận hành. ​ Khó khăn trong việc xử lý dữ liệu lớn: Khi làm việc với các tập dữ liệu lớn hoặc liên tục cập nhật, RAG có thể gặp khó khăn trong việc đảm bảo tính nhất quán và độ chính xác của thông tin truy xuất.   Để khắc phục những hạn chế của RAG, Cache-Augmented Generation (CAG) là một phương pháp thay thế hiệu quả. CAG hoạt động bằng cách tiền xử lý và lưu trữ thông tin cần thiết trong bộ nhớ đệm, cho phép mô hình tái sử dụng thông tin này khi cần thiết mà không phải truy xuất lại từ nguồn bên ngoài. ​ Hãy tưởng tượng bạn đang triển khai một trợ lý ảo cho nhân viên trong công ty, với mục tiêu trả lời các câu hỏi liên quan đến chính sách nội bộ như nghỉ phép, bảo hiểm, và quy trình làm việc. ​ Trong khi đó, với CAG, trước khi triển khai, bạn tiền xử lý và lưu trữ toàn bộ thông tin cần thiết (như chính sách công ty) vào bộ nhớ đệm của mô hình. Khi nhân viên đặt câu hỏi, mô hình sử dụng thông tin đã lưu trữ để trả lời ngay lập tức, không cần truy xuất dữ liệu bên ngoài.

So sánh MCP Servers và Agent
AI 12 - 04 - 2025

So sánh MCP Servers và Agent

Agent-based system là một mô hình trong đó các agent – những tác tử thông minh – được thiết kế để tự động thực hiện các nhiệm vụ dựa trên mục tiêu đã được xác định trước. Mỗi agent thường được trang bị khả năng lập kế hoạch (planning), bộ nhớ (memory) để ghi nhớ thông tin từ các lần tương tác trước, và đặc biệt là khả năng sử dụng công cụ (tools). Các công cụ này có thể là API, trình duyệt, máy tính, cơ sở dữ liệu, hoặc các module chức năng cụ thể mà agent có thể gọi đến khi cần thiết. Ngoài ra, một số agent còn có khả năng code execution – tức là tự sinh mã nguồn (thường bằng Python) và thực thi để giải quyết bài toán, tính toán hoặc phân tích dữ liệu ngay trong quá trình hoạt động. Phân tích yêu cầu, Gọi tool hoặc viết code để xử lý, Điểm mạnh của agent là khả năng tự định hướng hành động theo chuỗi logic đa bước mà không cần sự giám sát chặt chẽ từ con người. Tuy nhiên, điều này cũng khiến việc kiểm soát và tối ưu hành vi của agent trở nên khó khăn, nhất là khi có nhiều agent cùng hoạt động song song hoặc xử lý các tác vụ trừu tượng, phức tạp. Model Context Protocol (MCP) server là một hệ thống nằm ở phía sau, giúp các mô hình ngôn ngữ lớn (LLMs) như Claude hay GPT có thể làm việc hiệu quả hơn. Thay vì để mô hình AI tự mình truy cập dữ liệu, chạy công cụ hay ghi nhớ toàn bộ cuộc trò chuyện, MCP server sẽ đảm nhận những việc đó. Nó giống như một trợ lý điều phối thông minh, chuyên xử lý các yêu cầu, theo dõi ngữ cảnh cuộc hội thoại và cung cấp đúng công cụ hoặc dữ liệu cần thiết cho mô hình AI sử dụng. Observation: LLM ghi lại điều đang xảy ra, ví dụ như câu hỏi của người dùng.

Giới thiệu sách "Trí Tuệ Nhân Tạo cho Mọi Người"
Generative AI 08 - 04 - 2025

Giới thiệu sách "Trí Tuệ Nhân Tạo cho Mọi Người"

Giới thiệu sách "Trí Tuệ Nhân Tạo cho Mọi Người" – một cuốn sách đặc biệt được đồng sáng tác bởi Prof Happy + AI. Không phải là một tác phẩm học thuật nặng nề, cuốn sách này mang đến cái nhìn đơn giản, dễ hiểu, và cực kỳ gần gũi về trí tuệ nhân tạo – từ khái niệm cơ bản đến các ứng dụng trong đời sống, giáo dục, y tế, tài chính. . . 🧠💡 🎯 Đây là ví dụ điển hình cho thấy: AI đang tạo ra một cuộc cách mạng trong lĩnh vực sáng tạo và xuất bản. Nó giúp đơn giản hóa quy trình, rút ngắn thời gian biên tập và mở ra cánh cửa tri thức cho mọi người – đặc biệt là những ai chưa từng dám bước vào thế giới công nghệ!   #SIUAILab #AIForEveryone #BookByAI #TríTuệNhânTạo #HumansAndAI #SáchAI #AIxEducation #FutureOfLearning

Meta ra mắt bộ ba mô hình AI Llama 4
LLama 08 - 04 - 2025

Meta ra mắt bộ ba mô hình AI Llama 4

Llama 4 là thế hệ mô hình AI đa phương thức mới, đánh dấu một bước tiến đáng kể trong lĩnh vực này. Nó được phát triển bởi Meta và được thiết kế để mang lại sự hiểu biết và tạo sinh nội dung đa dạng một cách tự nhiên. Các điểm chính bao gồm: Llama 4 Behemoth: Mô hình lớn nhất với 288 tỷ tham số và 16 chuyên gia hoạt động. Nó được huấn luyện trên một lượng lớn dữ liệu đa phương thức. Llama 4 Scout: Mô hình nhỏ hơn với 16 tỷ tham số và cửa sổ ngữ cảnh công nghiệp là 10 nghìn tokens, với tổng cộng 1098 nghìn tokens. Các mô hình Llama 4 Scout là các mô hình đầu tiên của Meta AI chỉ dựa trên kiến trúc bộ mã hóa. Các mô hình MoE hiệu quả hơn nhiều về tính toán vì chúng chỉ kích hoạt một phần nhỏ tổng số tham số cho mỗi mã thông báo. Llama 4 Maverick được đánh giá là vượt trội so với Gemini 1. 5 Flash và Mistral Large trên một loạt các chuẩn mực. Theo các đánh giá nội bộ, Llama 4 Maverick và Llama 4 Scout vượt trội hơn đáng kể so với Llama 3 trên nhiều điểm chuẩn.

Information Retrieval (IR) – Hệ Thống Truy Xuất Thông Tin Trong Kỷ Nguyên Số
Information Retrieval 08 - 03 - 2025

Information Retrieval (IR) – Hệ Thống Truy Xuất Thông Tin Trong Kỷ Nguyên Số

1. Giới thiệu về Information Retrieval (IR)  Hãy tưởng tượng bạn đang đứng trong một thư viện khổng lồ với hàng triệu quyển sách. Bạn cần tìm một quyển sách về "Trí tuệ nhân tạo", nhưng bạn không nhớ tiêu đề chính xác. Bạn sẽ làm thế nào? Nếu có một thủ thư giỏi, họ sẽ giúp bạn tìm kiếm thông tin nhanh chóng dựa trên từ khóa bạn cung cấp. Information Retrieval hoạt động giống như thủ thư đó, nhưng ở quy mô toàn cầu trên Internet.   Information Retrieval là quá trình tìm kiếm, trích xuất và xếp hạng các tài nguyên thông tin phù hợp với nhu cầu của người dùng từ một tập hợp dữ liệu lớn.     2.  Information Retrieval có từ khi nào?  1960s - 1980s: Phát triển các mô hình tìm kiếm cơ bản như Boolean Model, Vector Space Model.