Tạo Dataset hội thoại

Dataset hội thoại là “bộ nhớ nền” giúp AI Agent hiểu đúng ngữ cảnh kinh doanh của bạn: câu hỏi khách hay hỏi, cách tư vấn, cách xử lý từ chối… Càng nhiều hội thoại chất lượng, mô hình sau khi fine-tune càng giống phong cách của chính đội ngũ bạn.

Quy trình tạo Dataset

Quy trình

Hướng dẫn

Demo

  1. Khai báo thông tin Dataset

  • Nhấn “Thêm mới” để mở khung "Tạo Dataset" ở bên phải màn hình.

  • Tại khung cấu hình Dataset, chọn Agent cần huấn luyện, nhập Tên Dataset thật dễ nhận diện, mô tả ngắn gọn mục đích sử dụng, chọn "Provider" phù hợp rồi lưu lại để cố định phần thông tin chung.

Bước 3: Tạo các cuộc hội thoại huấn luyện

Cách 1:Tạo các cuộc hội thoại huấn luyện (Thủ công)

  • Tại mục nội dung hội thoại, nhấn "Tạo đoạn chat mới", nhập lần lượt các lượt trao đổi giữa khách hàng và AI: bắt đầu bằng vai "User" (khách đặt câu hỏi, đưa yêu cầu, phản hồi…) và kết thúc bằng vai "AI Agent" (câu trả lời chuẩn, đầy đủ, đúng phong cách bạn muốn mô hình học theo).

  • Sau khi hoàn thành nội dung, nhấn "Lưu Dataset" để lưu dữ liệu hội thoại.

Lưu ý: Mỗi Dataset cần tối thiểu 10 cuộc hội thoại để có đủ dữ liệu (mức tối thiểu) cho quá trình Fine-tuning. Càng nhiều kịch bản đa dạng, Agent càng học tốt và phản hồi tự nhiên hơn.

Cách 2:Tạo các cuộc hội thoại huấn luyện (Import Jsonl)

  • Ở góc trên bên phải mục "Cập nhật Dataset", chọn biểu tượng "Import/Export"và nhấn "Import JSONL".

  • Chọn tệp JSONL chứa dữ liệu hội thoại từ thiết bị của bạn. Xác nhận tải tệp lên.

  • Sau khi tải thành công, danh sách hội thoại sẽ được tự động sinh ra tại khu vực "Nội dung hội thoại" dựa trên nội dung trong tệp JSONL.

Bước 4: Hoàn thiện Dataset

  • Dataset của bạn lúc này đã được lưu trong danh sách Dataset, sẵn sàng cho bước tiếp theo: Tạo model Fine-tuning dựa trên tập hội thoại vừa xây.