Metody zarządzania plikami w workspace
Podczas tworzenia workspace, mamy mozliwość wyboru jednej z dwóch metod zarządzania plikami - domyślny lub datastore.
Tryb Domyślny
Używając trybu domyślnego, pliki wgrane do workspace możesz dowolnie zaznaczać i odznaczać, co pozwala kontrolować, które z nich zostaną dodane do kontekstu, podczas wysyłania kolejnej wiadomości. Dodatkowo umożliwia zarządzanie plikami wysyłanymi bezpośrednio w wiadomości (w prompcie), które możemy podpiąć bezpośrednio do workspaace.
- pliki wgrywane do workspace są oceniane pod względem multimodalności;
- zaznaczone pliki są w całości wysyłane do LLM;
- możliwość pracy z obrazami i innymi foramtami nietekstowymi.
Tryb Datastore
W trybie Datastore, wgrane pliki są odpowiednio przetwarzane, dzielone na fragmenty i przechowywane w bazie wektorowej. LLM jest zasilany odpowiednimi fragmentami dokumentów na podstawie treści wiadomości użytkownika. Nadaje się do pracy z plikami tekstowymi (pdf, html, txt).
- wgrane pliki należy zaindeksować przed ich użyciem;
- po wysłaniu wiadomości, LLM zasilany jest jedynie najbardziej trafnymi fragmentami dokumentów;
- maksymalną ilość fragmentów przekazywanych do LLM możemy dostosowaywać w zależności od wyników, które otrzymujemy. Zbyt mała liczba może spowodować, że fragmenty z informacjami, których potrzebujemy, nie zostaną przekazane do modelu. Natomiast zbyt duża, może sprawić, że nadmiar informacji uniemożliwi modelowi precyzyjną odpowiedź na nasze pytanie;
- akceptowane jedynie pliki txt, html, pdf.
Use cases
Tryb Domyślny - analiza dokumentów / praca z dokumentami, gdze istotna jest cała ich treść;
Tryb Datastore - Q&A / wyszukiwanie konkretnych inforamcji w dużej ilości plików tekstowych;