Komunikaty PR

Jaki model AI wybrać? Jest już specjalny benchmark

2024-07-11 | 09:32

Salesforce wprowadził pierwszy na świecie benchmark LLM, który ma pomóc firmom w ocenie szybko rosnącej liczby dużych modeli językowych (LLM) do wykorzystania w ich systemach zarządzania relacjami z klientami (CRM).

Nowy benchmark to kompleksowe ramy oceny, które mierzą wydajność LLM w odniesieniu do czterech kluczowych miar: dokładności, kosztów, szybkości oraz zaufania i bezpieczeństwa. Został on zaprojektowany do oceny typowych przypadków użycia w sprzedaży i usługach, w tym prospectingu, lead nurturingu, a także podsumowań szans sprzedaży i przypadków usług. Benchmark udostępnia użytkownikom tabelę liderów, aby pomóc profesjonalistom zdecydować, który LLM najlepiej sprawdzi się w przypadku ich indywidualnych potrzeb. Salesforce będzie nadal włączać nowe scenariusze przypadków użycia do benchmarku i ulepszać ocenę LLM.

Dlaczego jest to ważne?

Istniejące benchmarki LLM są ograniczone do przypadków zastosowań akademickich i konsumenckich, a ich znaczenie dla biznesu jest bardzo niewielkie. Brakuje w nich również odpowiednich ocen ekspertów i nie uwzględniają one dokładności, szybkości, kosztów i kwestii zaufania. Te niedociągnięcia sprawiły, że firmy nie mają wiarygodnej metody oceny skuteczności generatywnych rozwiązań CRM opartych na sztucznej inteligencji. Bez wyraźnego poczucia, jak LLM sprawdzają się w tych metrykach dla konkretnych przypadków użycia, firmy muszą podejmować decyzje „po omacku”.

Opracowany przez Salesforce AI Research benchmark w wyjątkowy sposób wykorzystuje rzeczywiste dane CRM, a także eksperckie oceny dokonywane przez praktyków. Umożliwia to firmom wykorzystanie benchmarku do podejmowania bardziej strategicznych decyzji dotyczących sposobu włączenia generatywnej sztucznej inteligencji do ich systemów CRM.

Co mierzy benchmark?

Dokładność: Ta kategoria obejmuje cztery podkategorie: rzeczowość, kompletność, zwięzłość i zgodność z instrukcjami. Im dokładniejsze są przewidywania lub zalecenia, tym bardziej wartościowe będą wyniki dla zespołów w całej organizacji – a im bardziej wartościowe wyniki, tym lepsze działania mogą podjąć w celu poprawy obsługi klienta. Jeśli model jest wystarczająco dokładny dla danego przypadku użycia, ważne jest również, aby wziąć pod uwagę inne wskaźniki. Nawet jeśli model nie jest wystarczająco dokładny, techniki takie jak szybka inżynieria i dostrajanie mogą go poprawić.

Koszt: Metryka kosztów jest skategoryzowana jako wysoka, średnia i niska, w oparciu o percentyle. Jest to szacunkowy koszt operacyjny, który różni się w zależności od przypadku użycia. Klienci mogą ocenić opłacalność różnych rozwiązań LLM, aby upewnić się, że są one zgodne z ich budżetem i strategiami alokacji zasobów.

Szybkość: Ta metryka ocenia szybkość reakcji i wydajność LLM w przetwarzaniu oraz dostarczaniu informacji. Krótszy czas reakcji poprawia doświadczenie użytkownika, skracając czas oczekiwania klientów i umożliwiając zespołom sprzedaży oraz obsługi szybkie reagowanie na zapytania lub problemy.

Zaufanie i bezpieczeństwo: Ten wskaźnik mierzy zdolność LLM do ochrony wrażliwych danych klientów, przestrzegania przepisów dotyczących prywatności danych, zabezpieczania informacji oraz powstrzymywania się od stronniczości i toksyczności. Oceniając niezawodność LLM dla CRM, ten benchmark daje organizacjom poczucie przejrzystości w zakresie zaufania i bezpieczeństwa.

Dzięki platformie Einstein 1 firmy Salesforce, klienci mogą wybierać spośród istniejących rozwiązań LLM lub tworzyć własne modele spełniające ich unikalne potrzeby biznesowe. Wybierając modele dla swoich przypadków użycia CRM przy użyciu benchmarku, firmy mogą wdrażać bardziej skuteczne i wydajne rozwiązania generatywnej sztucznej inteligencji.

– Organizacje biznesowe chcą wykorzystać sztuczną inteligencję do napędzania wzrostu, obniżania kosztów i dostarczania spersonalizowanych doświadczeń klientów, a nie do planowania przyjęcia urodzinowego dla dzieci czy streszczania lektur szkolnych. Nasi klienci prosili o specjalnie opracowany sposób oceny i wyboru spośród mnożących się nowych modeli sztucznej inteligencji. Cieszymy się, że możemy wprowadzić pierwszy na świecie benchmark LLM dedykowany CRM, aby pomóc im poruszać się po złożonym krajobrazie modeli. Ten benchmark to nie tylko miara; to kompleksowa, dynamicznie ewoluująca struktura, która umożliwia firmom podejmowanie świadomych decyzji, równoważąc dokładność, koszty, szybkość i zaufanie – powiedziała Clara Shih, dyrektor generalna Salesforce AI.

Więcej informacji

Newseria nie ponosi odpowiedzialności za treści oraz inne materiały (np. infografiki, zdjęcia) przekazywane w „Biurze Prasowym”, których autorami są zarejestrowani użytkownicy tacy jak agencje PR, firmy czy instytucje państwowe.

Ostatnio dodane

komunikaty PR z wybranej przez Ciebie kategorii

IT i technologie

2025-06-25 | 03:00

Polski biznes nie jest przygotowany na cyberzagrożenia

Wyciek danych, ataki przeciążające stronę (DDoS), złośliwe oprogramowanie, phishing. Dziś wojna w cyberprzestrzeni dotyczy nie tylko infrastruktury krytycznej czy wielkich

IT i technologie

2025-06-04 | 15:30

Cyberbezpieczeństwo dla firm – skuteczne rozwiązania iIT Distribution Polska

Współczesne przedsiębiorstwa nie mogą pozwolić sobie na brak ochrony w świecie cyfrowym. Codziennie pojawiają się nowe zagrożenia: wycieki danych, ataki phishingowe,

IT i technologie

2025-05-13 | 14:45

Emitel Partnerem Technologicznym Impact’25

Emitel ponownie został Partnerem Technologicznym konferencji Impact’25 – jednego z najważniejszych wydarzeń poświęconych nowoczesnym technologiom, gospodarce

Polityka

Polska może się stać Doliną Krzemową Europy. Potrzeba jednak wsparcia finansowego start-upów i mocniejszej deregulacji

Polskie start-upy skoncentrowane są głównie na rozwoju nowoczesnych technologii informatycznych i cyfrowych. Wyraźny nacisk na oprogramowanie i aplikacje oraz big data i data science wskazuje na silne zainteresowanie narzędziami analitycznymi i rozwiązaniami wspierającymi transformację cyfrową w różnych branżach – wynika z raportu „Rynek start-upów w Polsce. Trendy technologiczne”, który został opracowany w 2024 roku w MRiT. Zdaniem europarlamentarzystów Polska ma szansę się stać Doliną Krzemową, jednak rozwój start-upów blokowany jest m.in. przez ograniczony dostęp do finansowania oraz niekorzystne i nadmierne regulacje.

Zdecydowane odbicie w liczbie ofert pracy dla programistów. Wynagrodzenia rosną, ale nie wrócą na dotychczasowe poziomy Duże możliwości korzystania z funduszy europejskich przez polskie firmy. Szczególnie w obszarze obronności Konkurencyjność firm wśród najważniejszych zadań dla kolejnego budżetu UE. Komisja szuka nowych źródeł dochodów UE w 80 proc. technologicznie polega na innych krajach. Zależność cyfrowa od USA i Chin może być zagrożeniem dla bezpieczeństwa Roboty w służbie środowisku. Ograniczanie ilości odpadów możliwe dzięki automatyzacji

Transport

Na półmetku wakacji ceny paliw na stacjach nie powinny się wyraźnie zmienić. Znaczące różnice między regionami i stacjami

W sierpniu ceny benzyny, oleju napędowego i autogazu powinny pozostać na poziomach z lipca – uważa ekspertka rynku z firmy Reflex. Wyższe będą zawsze na stacjach premium, tych, które oferują bogatszą ofertę dodatkową, promocje dla uczestników programu lojalnościowego, oraz w regionach, w których tradycyjnie paliwa są droższe ze względu np. na wyższą siłę nabywczą mieszkańców. Różnice mogą sięgać kilkudziesięciu groszy na litrze. Obszary, wokół których te wartości oscylują, zależą z kolei od sytuacji globalnej. Warto patrzeć na sytuację na Bliskim Wschodzie i w Ukrainie.

Polityka

A. Mularczyk (PiS): Nawiązanie poważnego dialogu z Niemcami jest konieczne nie tylko w kontekście reparacji. Powinien być podpisany traktat polsko-niemiecki

– Nie wystarczy jednorazowy gest czy inicjatywa. To musi być podjęcie dialogu, być może też przygotowanie nowej umowy bilateralnej, nowego traktatu polsko-niemieckiego, który regulowałby wszystkie obszary, które wynikały ze skutków II wojny światowej – mówi Arkadiusz Mularczyk, poseł do Parlamentu Europejskiego z PiS-u. Podkreśla, że proces ten nie będzie łatwy, bo wymaga konsekwencji i stanowczości, ale widzi szansę w prezydenturze Karola Nawrockiego, który już zadeklarował kontynuację starań w tym zakresie. Zdaniem europosła wsparciem w polsko-niemieckim dialogu może być administracja Donalda Trumpa.

Partner serwisu

Szkolenia

Akademia Newserii

Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.

Jaki model AI wybrać? Jest już specjalny benchmark

Polski biznes nie jest przygotowany na cyberzagrożenia

Cyberbezpieczeństwo dla firm – skuteczne rozwiązania iIT Distribution Polska

Emitel Partnerem Technologicznym Impact’25

Więcej ważnych informacji

Jedynka Newserii

Jedynka Newserii

Polityka

Polska może się stać Doliną Krzemową Europy. Potrzeba jednak wsparcia finansowego start-upów i mocniejszej deregulacji

Transport

Na półmetku wakacji ceny paliw na stacjach nie powinny się wyraźnie zmienić. Znaczące różnice między regionami i stacjami

Polityka

A. Mularczyk (PiS): Nawiązanie poważnego dialogu z Niemcami jest konieczne nie tylko w kontekście reparacji. Powinien być podpisany traktat polsko-niemiecki

Partner serwisu

Szkolenia

Akademia Newserii