Nói một cách dễ hiểu thì embedding là phương pháp biến các từ ngữ ở dạng không gian one shot thành không gian embedding

embedding database.Chroma cung cấp cho ta các công cụ sau:
Chroma lợi ích:
Dưới đây là hình minh hoạ cho việc search kết quả bằng embedding

→ Ở cxgenie chroma được dùng để vectorize các kiểu data nhập vào của customer. Sau đó lưu trữ để dùng cho việc query embedding, chỉ lấy ra những thông tin cần thiết, và gần chính xác nhất để feed cho chatgpt tránh việc gửi quá nhiều data không cần thiết dẫn tới kết quả trả về của AI không chính xác hoặc bị out limit legth data gửi đi.

Trong đó có hai ưu điểm chính của framework langchain là:
Cung cấp các component đa dạng: cung cấp cho người dùng các component tương tác với language model một cách dễ dàng, tuỳ biến và sử dụng trong nhiều trường hợp
Cung cấp các chains cho các use-case cụ thể: Một chains được hiểu là một chuỗi các component ghép nối lại với nhau theo thứ tự nhất định để từ đó có thể giải quyết được các trường hợp sử dụng trong thực tế. Các use-case mà langchain cung cấp như trợ lý ảo, hỏi đáp dựa trên các tài liệu, chatbot, hỗ trợ truy vấn dữ liệu bảng biểu, tương tác với các API, trích xuất đặc trưng của văn bản, đánh giá văn bản, tóm tắt văn bản.
→ Langchain có nhiều chain sử dụng cho từng trường hợp. Ví dụ như load_summarize_chain là chain được sử dụng để summarize một content, llmchain là chain được dùng để chat và trả lời cuộc hội thoại