обратно към уроците

Как да обучавате собствения си ChatGPT с помощта на вашите данни

Научете как да обучавате своя ChatGPT с персонализирани данни, като използвате набори от данни на ChatBotKit. Следвайте инструкциите стъпка по стъпка, за да създадете и конфигурирате набори от данни, да добавите файлове и интеграции и да създадете записи на набори от данни. Започнете да изграждате свой собствен разговорен бот с изкуствен интелект още днес!

ChatGPT, термин, въведен от OpenAI, често се използва като общ термин за описание на всеки голям езиков модел (LLM). Това е интерфейс за чатбот, който позволява комуникация с моделите на ИИ по разговорен начин. Днес ще обсъдим как можете да обучите свой собствен "ChatGPT" с потребителски данни, като използвате набори от данни ChatBotKit.

Before we proceed, let's understand what datasets are in the context of AI.

Какво представляват наборите от данни?

A dataset is a structured collection of data that can be used to provide additional context and information to your AI bot. It could include information on a variety of topics, such as product information, customer service queries, or general knowledge. Bots access datasets as needed during a conversation to generate responses based on user input and the data.

Ръководство стъпка по стъпка за използване на набори от данни на ChatBotKit

1. Създаване на набор от данни

Първо трябва да създадете нов набор от данни, като следвате следните стъпки:

  1. Go to "Datasets" from the navigation bar.
  2. Щракнете върху бутона "Create Dataset" (Създаване на набор от данни).
  3. Дайте име на набора си от данни и го опишете.
  4. Запазете набора от данни, като кликнете върху бутона "Create".

2. Конфигуриране на разширени опции

ChatBotKit provides several advanced options you can configure, including:

  • Записване на максимален брой жетони: Максималният брой токени, които да се използват за нови записи.
  • Търсене на максимални записи и токени: Максималният брой записи и токени, които да се използват за всяко търсене в набор от данни.
  • Инструкции за съвпадение и несъвпадение: Инструкции на бота по избор, които да се използват, когато е намерено или не е намерено съвпадение на запис на набор от данни.
  • Видимост на набора от данни: Посочете дали искате наборът от данни да бъде публичен или да остане частен.

3. Добавяне на файлове към набори от данни

Към наборите от данни могат да се прилагат файлове, които предоставят допълнителна информация и контекст. Поддържаните типове файлове включват .txt, .md, .csv, .json, .jsonl, .docx и .pdf. Тези файлове автоматично се разделят на записи, като поддържат набора от данни организиран и актуален.

4. Добавяне на интеграции

To automate the population of your datasets, you can take advantage of a variety of integrations. For instance, our Sitemap integration, also known as website importer, allows you to import data directly from your website into your dataset. Our Notion integration, known as Notion importer, enables you to seamlessly import data from your Notion documents. These integrations can significantly simplify the process of maintaining and updating your datasets, thus enhancing the performance and effectiveness of your bot.

5. Създаване на запис на набор от данни

Можете също така да създавате записи ръчно, като следвате следните стъпки:

  1. След като изберете набора от данни, щракнете върху бутона "Create Record" (Създаване на запис).
  2. Посочете текста на записа, като се съобразявате с общия брой символи.
  3. Запазете новия запис на набор от данни, като щракнете върху бутона "Create" (Създаване).

Не забравяйте, че ако записът на набора от данни съдържа повече от един параграф, може да пожелаете да го разделите на няколко записа.

Заключителни думи

By following these steps, you can successfully create and train your own ChatGPT-like bot using your custom data with ChatBotKit Datasets. Remember to experiment, iterate, and improve your datasets and models over time to achieve the best results. Happy training!