Jaki model AI wybrać? Jest już specjalny benchmark
Salesforce wprowadził pierwszy na świecie benchmark LLM, który ma pomóc firmom w ocenie szybko rosnącej liczby dużych modeli językowych (LLM) do wykorzystania w ich systemach zarządzania relacjami z klientami (CRM).
Nowy benchmark to kompleksowe ramy oceny, które mierzą wydajność LLM w odniesieniu do czterech kluczowych miar: dokładności, kosztów, szybkości oraz zaufania i bezpieczeństwa. Został on zaprojektowany do oceny typowych przypadków użycia w sprzedaży i usługach, w tym prospectingu, lead nurturingu, a także podsumowań szans sprzedaży i przypadków usług. Benchmark udostępnia użytkownikom tabelę liderów, aby pomóc profesjonalistom zdecydować, który LLM najlepiej sprawdzi się w przypadku ich indywidualnych potrzeb. Salesforce będzie nadal włączać nowe scenariusze przypadków użycia do benchmarku i ulepszać ocenę LLM.
Dlaczego jest to ważne?
Istniejące benchmarki LLM są ograniczone do przypadków zastosowań akademickich i konsumenckich, a ich znaczenie dla biznesu jest bardzo niewielkie. Brakuje w nich również odpowiednich ocen ekspertów i nie uwzględniają one dokładności, szybkości, kosztów i kwestii zaufania. Te niedociągnięcia sprawiły, że firmy nie mają wiarygodnej metody oceny skuteczności generatywnych rozwiązań CRM opartych na sztucznej inteligencji. Bez wyraźnego poczucia, jak LLM sprawdzają się w tych metrykach dla konkretnych przypadków użycia, firmy muszą podejmować decyzje „po omacku”.
Opracowany przez Salesforce AI Research benchmark w wyjątkowy sposób wykorzystuje rzeczywiste dane CRM, a także eksperckie oceny dokonywane przez praktyków. Umożliwia to firmom wykorzystanie benchmarku do podejmowania bardziej strategicznych decyzji dotyczących sposobu włączenia generatywnej sztucznej inteligencji do ich systemów CRM.
Co mierzy benchmark?
Dokładność: Ta kategoria obejmuje cztery podkategorie: rzeczowość, kompletność, zwięzłość i zgodność z instrukcjami. Im dokładniejsze są przewidywania lub zalecenia, tym bardziej wartościowe będą wyniki dla zespołów w całej organizacji – a im bardziej wartościowe wyniki, tym lepsze działania mogą podjąć w celu poprawy obsługi klienta. Jeśli model jest wystarczająco dokładny dla danego przypadku użycia, ważne jest również, aby wziąć pod uwagę inne wskaźniki. Nawet jeśli model nie jest wystarczająco dokładny, techniki takie jak szybka inżynieria i dostrajanie mogą go poprawić.
Koszt: Metryka kosztów jest skategoryzowana jako wysoka, średnia i niska, w oparciu o percentyle. Jest to szacunkowy koszt operacyjny, który różni się w zależności od przypadku użycia. Klienci mogą ocenić opłacalność różnych rozwiązań LLM, aby upewnić się, że są one zgodne z ich budżetem i strategiami alokacji zasobów.
Szybkość: Ta metryka ocenia szybkość reakcji i wydajność LLM w przetwarzaniu oraz dostarczaniu informacji. Krótszy czas reakcji poprawia doświadczenie użytkownika, skracając czas oczekiwania klientów i umożliwiając zespołom sprzedaży oraz obsługi szybkie reagowanie na zapytania lub problemy.
Zaufanie i bezpieczeństwo: Ten wskaźnik mierzy zdolność LLM do ochrony wrażliwych danych klientów, przestrzegania przepisów dotyczących prywatności danych, zabezpieczania informacji oraz powstrzymywania się od stronniczości i toksyczności. Oceniając niezawodność LLM dla CRM, ten benchmark daje organizacjom poczucie przejrzystości w zakresie zaufania i bezpieczeństwa.
Dzięki platformie Einstein 1 firmy Salesforce, klienci mogą wybierać spośród istniejących rozwiązań LLM lub tworzyć własne modele spełniające ich unikalne potrzeby biznesowe. Wybierając modele dla swoich przypadków użycia CRM przy użyciu benchmarku, firmy mogą wdrażać bardziej skuteczne i wydajne rozwiązania generatywnej sztucznej inteligencji.
– Organizacje biznesowe chcą wykorzystać sztuczną inteligencję do napędzania wzrostu, obniżania kosztów i dostarczania spersonalizowanych doświadczeń klientów, a nie do planowania przyjęcia urodzinowego dla dzieci czy streszczania lektur szkolnych. Nasi klienci prosili o specjalnie opracowany sposób oceny i wyboru spośród mnożących się nowych modeli sztucznej inteligencji. Cieszymy się, że możemy wprowadzić pierwszy na świecie benchmark LLM dedykowany CRM, aby pomóc im poruszać się po złożonym krajobrazie modeli. Ten benchmark to nie tylko miara; to kompleksowa, dynamicznie ewoluująca struktura, która umożliwia firmom podejmowanie świadomych decyzji, równoważąc dokładność, koszty, szybkość i zaufanie – powiedziała Clara Shih, dyrektor generalna Salesforce AI.
Trina Storage i TÜV NORD: biała księga o bezpieczeństwie magazynów energii
Kup monitor MSI QD-OLED i odbierz epickie nagrody. Darmowa gra S.T.A.L.K.E.R. 2
Jason Statham w World of Tanks
Kalendarium
Więcej ważnych informacji
Jedynka Newserii
Jedynka Newserii
Prawo
Ulga na badania i rozwój może być lekiem na rosnące koszty zatrudnienia. Korzysta z niej tylko 1/4 uprawnionych firm
Wysokie koszty zatrudnienia to w tej chwili jedno z poważniejszych wyzwań utrudniających działalność i hamujących rozwój polskich przedsiębiorstw. – Skuteczną odpowiedzią może być ulga badawczo-rozwojowa – wskazuje Piotr Frankowski, dyrektor zarządzający Ayming Polska. Ten instrument umożliwia odliczenie nawet 200 proc. kosztów osobowych, czyli m.in. wynagrodzeń, od podstawy opodatkowania. Ulgę B-+R zna 90 proc. rodzimych przedsiębiorstw, ale korzysta z niej mniej niż 1/4 uprawnionych. Firma, wspólnie z Konfederacją Lewiatan, przedstawiła rządowi szereg rekomendacji działań, które mogłyby te statystyki poprawić.
Farmacja
Diagnostyka obrazowa w Polsce nie odbiega jakością od Europy Zachodniej. Rośnie dostępność badań i świadomość pacjentów
Na podstawie wyników diagnostyki obrazowej, czyli m.in. tomografii komputerowej, USG, RTG czy rezonansu magnetycznego, podejmowanych jest nawet 80 proc. decyzji klinicznych. – Diagnostyka obrazowa będzie miała coraz większe znaczenie w medycynie – mówi prof. nadzw. dr hab. n. med. Jakub Swadźba, założyciel i prezes zarządu Diagnostyka SA. Jak ocenia, ten segment w Polsce jest już na światowym poziomie, a ostatnie lata przyniosły znaczący postęp związany z upowszechnieniem nowych technologii i nowoczesnych rozwiązań.
Ochrona środowiska
Europa przegrywa globalny wyścig gospodarczy. Nowa KE będzie musiała podjąć szybkie i zdecydowane działania
Udział Europy w światowej gospodarce się kurczy. Podczas gdy jeszcze w 2010 roku gospodarki UE i USA były mniej więcej tej samej wielkości, tak dekadę później, w 2020 roku Wspólnota znalazła się już znacznie poniżej poziomu amerykańskiego. – Niedługo jedynym, co Europa będzie mogła zaoferować światu, będą konsumenci – mówi europosłanka Ewa Zajączkowska-Hernik. Jak wskazuje, przywrócenie gospodarczej atrakcyjności UE powinno być priorytetem nowej Komisji Europejskiej, ale nie da się tego pogodzić z zaostrzeniem polityki klimatycznej.
Partner serwisu
Szkolenia
Akademia Newserii
Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.