Komunikaty PR

Jaki model AI wybrać? Jest już specjalny benchmark

2024-07-11  |  09:32
Biuro prasowe

Salesforce wprowadził pierwszy na świecie benchmark LLM, który ma pomóc firmom w ocenie szybko rosnącej liczby dużych modeli językowych (LLM) do wykorzystania w ich systemach zarządzania relacjami z klientami (CRM).

Nowy benchmark to kompleksowe ramy oceny, które mierzą wydajność LLM w odniesieniu do czterech kluczowych miar: dokładności, kosztów, szybkości oraz zaufania i bezpieczeństwa. Został on zaprojektowany do oceny typowych przypadków użycia w sprzedaży i usługach, w tym prospectingu, lead nurturingu, a także podsumowań szans sprzedaży i przypadków usług. Benchmark udostępnia użytkownikom tabelę liderów, aby pomóc profesjonalistom zdecydować, który LLM  najlepiej sprawdzi się w przypadku ich indywidualnych potrzeb. Salesforce będzie nadal włączać nowe scenariusze przypadków użycia do benchmarku i ulepszać ocenę LLM.

Dlaczego jest to ważne?

Istniejące benchmarki LLM są ograniczone do przypadków zastosowań akademickich i konsumenckich, a ich znaczenie dla biznesu jest bardzo niewielkie. Brakuje w nich również odpowiednich ocen ekspertów i nie uwzględniają one dokładności, szybkości, kosztów i kwestii zaufania. Te niedociągnięcia sprawiły, że firmy nie mają wiarygodnej metody oceny skuteczności generatywnych rozwiązań CRM opartych na sztucznej inteligencji. Bez wyraźnego poczucia, jak LLM sprawdzają się w tych metrykach dla konkretnych przypadków użycia, firmy muszą podejmować decyzje „po omacku”.

Opracowany przez Salesforce AI Research benchmark w wyjątkowy sposób wykorzystuje rzeczywiste dane CRM, a także eksperckie oceny dokonywane przez praktyków. Umożliwia to firmom wykorzystanie benchmarku do podejmowania bardziej strategicznych decyzji dotyczących sposobu włączenia generatywnej sztucznej inteligencji do ich systemów CRM.

Co mierzy benchmark?

Dokładność: Ta kategoria obejmuje cztery podkategorie: rzeczowość, kompletność, zwięzłość i zgodność z instrukcjami. Im dokładniejsze są przewidywania lub zalecenia, tym bardziej wartościowe będą wyniki dla zespołów w całej organizacji – a im bardziej wartościowe wyniki, tym lepsze działania mogą podjąć w celu poprawy obsługi klienta. Jeśli model jest wystarczająco dokładny dla danego przypadku użycia, ważne jest również, aby wziąć pod uwagę inne wskaźniki. Nawet jeśli model nie jest wystarczająco dokładny, techniki takie jak szybka inżynieria i dostrajanie mogą go poprawić.

Koszt: Metryka kosztów jest skategoryzowana jako wysoka, średnia i niska, w oparciu o percentyle. Jest to szacunkowy koszt operacyjny, który różni się w zależności od przypadku użycia. Klienci mogą ocenić opłacalność różnych rozwiązań LLM, aby upewnić się, że są one zgodne z ich budżetem i strategiami alokacji zasobów.

Szybkość: Ta metryka ocenia szybkość reakcji i wydajność LLM w przetwarzaniu oraz dostarczaniu informacji. Krótszy czas reakcji poprawia doświadczenie użytkownika, skracając czas oczekiwania klientów i umożliwiając zespołom sprzedaży oraz obsługi szybkie reagowanie na zapytania lub problemy.

Zaufanie i bezpieczeństwo: Ten wskaźnik mierzy zdolność LLM do ochrony wrażliwych danych klientów, przestrzegania przepisów dotyczących prywatności danych, zabezpieczania informacji oraz powstrzymywania się od stronniczości i toksyczności. Oceniając niezawodność LLM dla CRM, ten benchmark daje organizacjom poczucie przejrzystości w zakresie zaufania i bezpieczeństwa.

Dzięki platformie Einstein 1 firmy Salesforce, klienci mogą wybierać spośród istniejących rozwiązań LLM lub tworzyć własne modele spełniające ich unikalne potrzeby biznesowe. Wybierając modele dla swoich przypadków użycia CRM przy użyciu benchmarku, firmy mogą wdrażać bardziej skuteczne i wydajne rozwiązania generatywnej sztucznej inteligencji.

Organizacje biznesowe chcą wykorzystać sztuczną inteligencję do napędzania wzrostu, obniżania kosztów i dostarczania spersonalizowanych doświadczeń klientów, a nie do planowania przyjęcia urodzinowego dla dzieci czy streszczania lektur szkolnych. Nasi klienci prosili o specjalnie opracowany sposób oceny i wyboru spośród mnożących się nowych modeli sztucznej inteligencji. Cieszymy się, że możemy wprowadzić pierwszy na świecie benchmark LLM dedykowany CRM, aby pomóc im poruszać się po złożonym krajobrazie modeli. Ten benchmark to nie tylko miara; to kompleksowa, dynamicznie ewoluująca struktura, która umożliwia firmom podejmowanie świadomych decyzji, równoważąc dokładność, koszty, szybkość i zaufanie – powiedziała Clara Shih, dyrektor generalna Salesforce AI.

Więcej informacji
Newseria nie ponosi odpowiedzialności za treści oraz inne materiały (np. infografiki, zdjęcia) przekazywane w „Biurze Prasowym”, których autorami są zarejestrowani użytkownicy tacy jak agencje PR, firmy czy instytucje państwowe.
Ostatnio dodane
komunikaty PR z wybranej przez Ciebie kategorii
IT i technologie Długoterminowa umowa TomTom i Microsoft Biuro prasowe
2024-07-16 | 07:50

Długoterminowa umowa TomTom i Microsoft

TomTom (TOM2), specjalista w dziedzinie technologii geolokalizacji, ogłosił, że umacnia i rozszerza swoją współpracę z firmą Microsoft. Mapy i dane o ruchu drogowym TomTom będą
IT i technologie TomTom i East View Geospatial łączą siły
2024-07-11 | 17:40

TomTom i East View Geospatial łączą siły

TomTom (TOM2), specjalista w dziedzinie technologii geolokalizacji, oraz East View Geospatial (EVG) ogłosili dziś współpracę w zakresie dostarczania globalnych danych mapowych dla
IT i technologie AUVIDIA, OBIECUJĄCY LIDER W DZIEDZINIE AI, WSPÓŁPRACUJE Z PANASONIC
2024-07-11 | 13:00

AUVIDIA, OBIECUJĄCY LIDER W DZIEDZINIE AI, WSPÓŁPRACUJE Z PANASONIC

Przenosząc produkcję swoich spersonalizowanych płytek nośnych AI do własnych zakładów, firma Auvidea potrzebowała zaufanego partnera, który mógłby dostarczyć

Kalendarium

Więcej ważnych informacji

Konkurs Polskie Branży PR

Jedynka Newserii

Jedynka Newserii

Transport

Polska kolej potrzebuje zarówno nowych inwestycji, jak i realizacji prac utrzymaniowych istniejących linii. Temu do tej pory poświęcano za mało uwagi

Długość linii kolejowych w Polsce w eksploatacji wyniosła w 2023 roku 19 574 km – podał Urząd Transportu Kolejowego. W ocenie regulatora parametry linii kolejowych z roku na rok są na coraz wyższym poziomie, co wpływa na jakość realizowanych przewozów. W ocenie Adriana Furgalskiego z ZDG TOR powinniśmy więcej uwagi poświęcać pracom utrzymaniowym na kolei. Ten aspekt w dużej mierze był lekceważony, co skutkowało poważniejszymi, czyli droższymi i bardziej uciążliwymi pracami remontowymi.

Nauka

Na włączeniu komercyjnych projektów do programu Copernicus już korzystają polskie firmy. Jeszcze w tym roku na orbitę trafi największy polski układ optyczny EagleEye

Obecnie działa około 20 misji wspomagających program Copernicus, które dostarczają dane do usług działających w ramach programu. Planowanych jest kolejnych 10 służących m.in. do obserwacji lądu, badania aktywności i dynamiki oceanów, pomiaru jakości powietrza, monitorowania temperatury lądu i oceanu. Mogą wśród nich być również polskie satelity. – Nowa strategia Komisji Europejskiej i Europejskiej Agencji Kosmicznej, która włącza komercyjne systemy, to szansa dla Polski na budowę gospodarki opartej na wiedzy – ocenia Anna Burzykowska, oficer ds. innowacji w programie Copernicus Europejskiej Agencji Kosmicznej. Takim komercyjnym projektem z Polski jest satelita EagleEye, który jeszcze w tym roku ma zostać wyniesiony na orbitę.

Bankowość

Polskie banki nie zwalniają procesu digitalizacji. Wydatki na technologie stanowią nawet do 70 proc. ich kosztów

– Technologie mają w tej chwili duży wpływ na strategie biznesowe banków. Są też istotną pozycją w kosztach, w niektórych bankach wydatki na technologie stanowią nawet do 70 proc. ich całkowitych kosztów działalności – mówi dr Marek Radzikowski, wiceprezes zarządu PKO BP. Jak wskazuje, w centrum zainteresowania sektora bankowego są w tej chwili zwłaszcza te technologie, które pozwalają optymalizować obsługę klientów i podnosić jej jakość. Globalna analiza Bain & Company pokazuje, że takie inwestycje dają wymierne korzyści. Banki, które są liderami cyfryzacji, osiągają znacznie lepsze wyniki finansowe i mają bardziej lojalnych klientów niż pozostała część rynku.

Partner serwisu

Instytut Monitorowania Mediów

Szkolenia

Akademia Newserii

Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a  także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.