AI 17 - 04 - 2025

LabXperience: Setup BrowserMCP để LLM điều khiển Browser của bạn

Bài viết hướng dẫn từng bước cách thiết lập và sử dụng Browser MCP, một công cụ giúp mô hình ngôn ngữ lớn (LLM) như ChatGPT hoặc Copilot tương tác trực tiếp với trình duyệt web thông qua các thao tác như truy cập trang web, điền form, click nút, trích xuất dữ liệu. . .   Biết cách cài đặt Browser MCP và cấu hình với Visual Studio Code, trình duyệt (Chrome/Edge) và Copilot. Hiểu cơ chế hoạt động của Browser MCP: cách LLM sử dụng các “tool” như browser_navigate, browser_click, browser_type,… Thực hành các truy vấn thực tế để AI thao tác trên trình duyệt như một người dùng thật. Nhận diện được tiềm năng ứng dụng của Browser MCP trong tự động hóa thao tác web, cào dữ liệu và kiểm thử phần mềm bằng AI agent.

AI 13 - 04 - 2025

Cache-Augmented Generation là gì và nó có tốt hơn RAG?

  Cách thức hoạt động: Khi mô hình nhận dữ liệu đầu vào, thay vì phải truy xuất dữ liệu hoặc tính toán mọi thứ từ đầu, nó sử dụng bộ nhớ đã được tính toán sẵn (KV-cache). Bộ nhớ này chứa các thông tin liên quan mà mô hình có thể tái sử dụng trong quá trình sinh câu trả lời. Pre-computation of Data: Trước khi sử dụng, dữ liệu sẽ được tính toán và lưu vào bộ nhớ KV. Việc này giúp giảm tải cho mô hình trong quá trình xử lý và sinh văn bản. Lợi ích: Giảm thiểu độ trễ: Vì thông tin đã được tính toán và lưu trữ sẵn, quá trình sinh văn bản trở nên nhanh hơn. Tiết kiệm tài nguyên tính toán: Mô hình không cần phải truy xuất từ các cơ sở dữ liệu hoặc tính toán lại mọi thứ từ đầu.

AI 12 - 04 - 2025

So sánh MCP Servers và Agent

Agent-based system là một mô hình trong đó các agent – những tác tử thông minh – được thiết kế để tự động thực hiện các nhiệm vụ dựa trên mục tiêu đã được xác định trước. Mỗi agent thường được trang bị khả năng lập kế hoạch (planning), bộ nhớ (memory) để ghi nhớ thông tin từ các lần tương tác trước, và đặc biệt là khả năng sử dụng công cụ (tools). Các công cụ này có thể là API, trình duyệt, máy tính, cơ sở dữ liệu, hoặc các module chức năng cụ thể mà agent có thể gọi đến khi cần thiết. Ngoài ra, một số agent còn có khả năng code execution – tức là tự sinh mã nguồn (thường bằng Python) và thực thi để giải quyết bài toán, tính toán hoặc phân tích dữ liệu ngay trong quá trình hoạt động. Phân tích yêu cầu, Gọi tool hoặc viết code để xử lý, Điểm mạnh của agent là khả năng tự định hướng hành động theo chuỗi logic đa bước mà không cần sự giám sát chặt chẽ từ con người. Tuy nhiên, điều này cũng khiến việc kiểm soát và tối ưu hành vi của agent trở nên khó khăn, nhất là khi có nhiều agent cùng hoạt động song song hoặc xử lý các tác vụ trừu tượng, phức tạp. Model Context Protocol (MCP) server là một hệ thống nằm ở phía sau, giúp các mô hình ngôn ngữ lớn (LLMs) như Claude hay GPT có thể làm việc hiệu quả hơn. Thay vì để mô hình AI tự mình truy cập dữ liệu, chạy công cụ hay ghi nhớ toàn bộ cuộc trò chuyện, MCP server sẽ đảm nhận những việc đó. Nó giống như một trợ lý điều phối thông minh, chuyên xử lý các yêu cầu, theo dõi ngữ cảnh cuộc hội thoại và cung cấp đúng công cụ hoặc dữ liệu cần thiết cho mô hình AI sử dụng. Observation: LLM ghi lại điều đang xảy ra, ví dụ như câu hỏi của người dùng.

Generative AI 08 - 04 - 2025

Giới thiệu sách "Trí Tuệ Nhân Tạo cho Mọi Người"

Giới thiệu sách "Trí Tuệ Nhân Tạo cho Mọi Người" – một cuốn sách đặc biệt được đồng sáng tác bởi Prof Happy + AI. Không phải là một tác phẩm học thuật nặng nề, cuốn sách này mang đến cái nhìn đơn giản, dễ hiểu, và cực kỳ gần gũi về trí tuệ nhân tạo – từ khái niệm cơ bản đến các ứng dụng trong đời sống, giáo dục, y tế, tài chính. . . 🧠💡 🎯 Đây là ví dụ điển hình cho thấy: AI đang tạo ra một cuộc cách mạng trong lĩnh vực sáng tạo và xuất bản. Nó giúp đơn giản hóa quy trình, rút ngắn thời gian biên tập và mở ra cánh cửa tri thức cho mọi người – đặc biệt là những ai chưa từng dám bước vào thế giới công nghệ!   #SIUAILab #AIForEveryone #BookByAI #TríTuệNhânTạo #HumansAndAI #SáchAI #AIxEducation #FutureOfLearning

LLama 08 - 04 - 2025

Meta ra mắt bộ ba mô hình AI Llama 4

Llama 4 là thế hệ mô hình AI đa phương thức mới, đánh dấu một bước tiến đáng kể trong lĩnh vực này. Nó được phát triển bởi Meta và được thiết kế để mang lại sự hiểu biết và tạo sinh nội dung đa dạng một cách tự nhiên. Các điểm chính bao gồm: Llama 4 Behemoth: Mô hình lớn nhất với 288 tỷ tham số và 16 chuyên gia hoạt động. Nó được huấn luyện trên một lượng lớn dữ liệu đa phương thức. Llama 4 Scout: Mô hình nhỏ hơn với 16 tỷ tham số và cửa sổ ngữ cảnh công nghiệp là 10 nghìn tokens, với tổng cộng 1098 nghìn tokens. Các mô hình Llama 4 Scout là các mô hình đầu tiên của Meta AI chỉ dựa trên kiến trúc bộ mã hóa. Các mô hình MoE hiệu quả hơn nhiều về tính toán vì chúng chỉ kích hoạt một phần nhỏ tổng số tham số cho mỗi mã thông báo. Llama 4 Maverick được đánh giá là vượt trội so với Gemini 1. 5 Flash và Mistral Large trên một loạt các chuẩn mực. Theo các đánh giá nội bộ, Llama 4 Maverick và Llama 4 Scout vượt trội hơn đáng kể so với Llama 3 trên nhiều điểm chuẩn.

Bài Đọc Nhiều Nhất

Tổng hợp các mô hình CNN nổi tiếng - Phần 1

Tổng quan ROS cơ bản

Hướng dẫn cài đặt và thực hành Spring Boot (Phần 1)