


Vergleich der Gemini-Einbettung in mehrsprachige E5-Large & Jina
Mar 20, 2025 pm 03:02 PMGemini -Einbettung: Mehrsprachiger Texteinbettungsmodell unter Google Gemini AI Framework
Die Worteinbettung ist für Aufgaben (natürliche Sprachverarbeitung) in Hindi von entscheidender Bedeutung, wie z. B. maschinelle übersetzung, Frage und Beantwortung sowie das Abrufen von Informationen. Diese Einbettungen erfassen die semantischen Eigenschaften von W?rtern und erm?glichen eine genauere und kontextorientierte NLP-Anwendungen. Angesichts der gro?en Anzahl von Hindi-Sprechern und dem wachsenden Zahleninhalt der Hindi-Sprache ist eine hochwertige Einbettung von entscheidender Bedeutung, um die NLP-Leistung in diesen Sprachen zu verbessern. Eine individuelle Einbettung kann speziell die einzigartigen Sprachmerkmale und Ressourcenbeschr?nkungen der indischen Sprachfamilie l?sen. Das neu ver?ffentlichte Gemini-Einbettungsmodell stellt einen signifikanten Fortschritt bei der Einbettung von mehrsprachigen Text dar und nutzt Googles leistungsstarke Gemini-AI-Framework von Google, um eine modernste Leistung in über 100 Sprachen zu erzielen.
Das Gemini -Einbettungsmodell ist bei Aufgaben wie Klassifizierung, Abruf und semantischer Suche gut und bietet eine gr??ere Effizienz und Genauigkeit. Durch die Unterstützung gr??erer Eingangsskalen und h?herdimensionalen Ausg?nge bietet Gemini -Einbettung reichhaltigere Textdarstellungen, sodass sie in einer Vielzahl von Anwendungen h?ufig verwendet werden k?nnen.
Lernziele
- Erfahren Sie mehr über die Gemini -Einbettung und seine Integration mit Gemini LLM.
- Praktische Tutorials zum Abrufen von Hindi -Dokumenten unter Verwendung von Gemini Embed.
- Vergleichende Analyse mit Jina AI Einbettung und mehrsprachiger E5-Large.
- Erkenntnisse über mehrsprachige Funktionen und Anwendungen von Textbereichen.
*Dieser Artikel wird als Teil des *** Data Science Blog Marathon ver?ffentlicht . ***
Inhaltsverzeichnis
- Was ist Gemini eingebettet?
- Schlüsselmerkmale der Gemini -Einbettung
- Gemini Embedded Model Architecture
- Vergleich mit anderen mehrsprachigen Einbettungsmodellen
- Abrufen mit Gemini-Einbettung und Vergleich zu Jina AI Einbettung und mehrsprachiger E5-Large
- Schritt 1. Installieren Sie die erforderlichen Bibliotheken
- Schritt 2. Laden Sie die Daten
- Schritt 3. Blockieren Sie die Daten
- Schritt 4. Speichern Sie die Daten in der Vektor -Datenbank
- Schritt 5. Abfragen Sie die Datenbank ab
- Schritt 6. Vergleiche mit Jina AI Einbettung
- Vergleich der Einbett -Suchausgabe
- erkl?ren
- abschlie?end
- H?ufig gestellte Fragen
Was ist Gemini eingebettet?
Im M?rz 2025 ver?ffentlichte Google ein neues experimentelles Gemini-Einbettungstextmodell (Gemini-Embedding-EXP-03-07), das in der Gemini-API verwendet werden kann.
Das erweiterte Einbettungsmodell stammt aus dem Gemini -Modell, das das tiefgreifende Verst?ndnis von Nuancen von Sprache und subtilen Kontexten von Gemini erben und es erm?glicht, in einer Vielzahl von Anwendungen weit verbreitet zu sein. Es steht in der MTEB -mehrsprachigen Rangliste an erster Stelle.
Die Gemini -Einbettung repr?sentiert Text als dichte Vektoren, bei denen Texteingaben mit ?hnlicher Semantik Vektoren im Vektorraum zugeordnet werden, die nahe beieinander liegen. Derzeit unterstützt es über 100 Sprachen, und seine Einbettung kann für eine Vielzahl von Aufgaben wie Abruf und Klassifizierung verwendet werden.
Schlüsselmerkmale der Gemini -Einbettung
- Starke mehrsprachige F?higkeiten : Dieses Modell zeigt eine herausragende Leistung in über 100 Sprachen, nicht nur in hochressourcen-Sprachen wie Englisch, sondern auch in Sprachen mit niedrigem Ressourcen wie Assamesen und Mazedonier.
- Verarbeitung von bis zu 8000 Eingabetags : Mit dieser leistungsstarken F?higkeit k?nnen Modelle ohne Kürzung nahtlos lange Dokumente oder komplexe Abfragen verarbeiten und so den Kontext und die Bedeutung auf eine Weise aufrechterhalten, die über viele vorhandene eingebettete Modelle hinausgeht.
- Ausgangsabmessungen für 3K-Dimensionen : Dieses Modell erzeugt eine Einbettungsdimension bis zu 3072 und unterstützt die subdimensionale Abmessung wie 768 und 1536 für die aufgabenspezifische Optimierung.
- Beeindruckende Leistung : Gemini -Einbettung in der massiven Texteinbettungsbenchmark (MTEB) mit einem durchschnittlichen Aufgabenwert von 68,32, der seinen engsten Konkurrenten erheblich übertrifft.
Gemini Embedded Model Architecture
Der Kern der Gemini -Einbettung basiert auf der Transformatorarchitektur und aus Gemini LLM initialisiert. Diese Grundlage bietet ein tiefes Verst?ndnis der Sprachstruktur und der Semantik für das Modell. Das Modell verwendet einen bidirektionalen Aufmerksamkeitsmechanismus, um Eingangssequenzen so zu verarbeiten, dass es den vollst?ndigen Kontext eines Wortes oder einer Phrase beim Erstellen einer Einbettung berücksichtigen kann.
- Die Eingangssequenz T wird durch M (ein Transformator mit bidirektionaler Aufmerksamkeit, initialisiert aus Gemini) verarbeitet, was zu einer Marker -Einbettungssequenz führt.
- Um eine einzelne Einbettung zu generieren, die alle Informationen in der Eingabe darstellt, wird eine Pooling -Funktion angewendet.
- Schlie?lich wird eine lineare Projektion angewendet, um die Einbettung in die Zieldimension zu skalieren, was zur endgültigen Ausgangsbettung führt.
Verlustfunktion : Das Gemini-Einbettungsmodell wird unter Verwendung von NCCE-Verlusten (Rauschenvergleichssch?tzungen) mit negativen Beispielen in den Batch trainiert. Der genaue Verlust variiert je nach Trainingsphase geringfügig. Im Allgemeinen umfasst ein Trainingsbeispiel eine Abfrage, ein positives Ziel und (optional) ein schwieriges Ziel.
Trainingsstrategien
- Vorabstimmung : In diesem Stadium wird das Modell auf einem gro?en diversifizierten Datensatz mit Abfragestellpaaren trainiert. Diese Belichtung passt die Parameter gro?er Sprachmodelle für die Codierung von Aufgaben an und legt den Grundstein für ihre Anpassungsf?higkeit.
- Feinabstimmung : In der zweiten Phase verwendet das Modell einen aufgabenspezifischen Datensatz mit einem dreifachen Abfrage-positiv-difficult-negativen Beispielen. Dieser Prozess verwendet kleinere Chargengr??en und gut kuratierte Datens?tze, um die Leistung von Zielaufgaben zu verbessern.
Lesen Sie auch: Gemini Einbettung: Universelle Einbettung aus Gemini
Vergleich mit anderen mehrsprachigen Einbettungsmodellen
Wir vergleichen die Suche nach Hindi-Dokumenten mit den neuesten neu ver?ffentlichten Gemini-Einbettungen und vergleichen sie dann mit Jina AI-Einbettungen und mehrsprachigen E-E5-Large-Einbettungen. Wie in der folgenden Tabelle gezeigt, sind die Einbettung von Gemini und die Einbettung von Jina AI hinsichtlich der maximalen Anzahl von Tags hoch, sodass das Modell lange Dokumente oder komplexe Abfragen verarbeiten kann. Darüber hinaus weisen Gemini -Einbettungen, wie in der folgenden Tabelle gezeigt, eine h?here Einbettungsdimension auf, die detailliertere und differenziertere semantische Beziehungen zwischen W?rtern erfasst, sodass Modelle nuancierte Unterschiede in komplexen Sprachmustern und -bedeutungen darstellen k?nnen.
Anzahl der Parameter | Dimensionen einbetten | Maximale Marke | Anzahl der Sprachen | Puppenbettung | |
Gemini-Embedding-EXP-03-07 | unbekannt | 3072 | 8192 | 100 | Unterstützt die Abschneidung von Einbettungen in verschiedenen Gr??en, wie beispielsweise 2048, 1024, 512, 256 und 128 Dimensionen, |
Jinaai/Jina-Embeddings-V3 | 572 Millionen | 1024 | 8194 | 100 | Unterstützt flexible Einbettungsgr??en (32, 64, 128, 256, 512, 768, 1024), sodass verkürzte Einbettungen zu Ihrer Anwendung passen k?nnen |
Mehrsprachiger-e5-large-instruct | 560 Millionen | 1024 | 514 | 94 | N / A |
Abrufen mit Gemini-Einbettung und Vergleich zu Jina AI Einbettung und mehrsprachiger E5-Large
Im folgenden praktischen Tutorial vergleichen wir die Suche nach Hindi-Dokumenten mit den neuesten neu ver?ffentlichten Gemini-Einbettungen und vergleichen sie dann mit Jina AI-Einbettungen und mehrsprachigen E5-Large-Einbettungen.
Schritt 1. Installieren Sie die erforderlichen Bibliotheken
<code>!pip install langchain-community !pip install chromadb</code>
Schritt 2. Laden Sie die Daten
Wir haben Hindi -Daten von der Website verwendet, um die Leistung von Gemini -Einbetten in das Abrufen von Hindi -Sprachen zu bewerten.
<code>from langchain_community.document_loaders import WebBaseLoader loader = WebBaseLoader("https://ckbirlahospitals.com/rbh/blog/pregnancy-early-symptoms-in-hindi") data = loader.load()</code>
Schritt 3. Blockieren Sie die Daten
Der folgende Code verwendet recursivecharactertextSplitter, um ein gro?es Textdokument ohne überlappung in 500-Charakter-Stücke aufzuteilen. Anschlie?end wird diese Aufteilung auf den Datavariable angewendet und das Ergebnis in All_Splits gespeichert. Aufgrund der Ratengrenzen der Gemini -Einbettungs -API verwenden wir nur 10 Spaltungen.
<code>from langchain_text_splitters import RecursiveCharacterTextSplitter text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0) all_splits = text_splitter.split_documents(data) all_splits = all_splits[:10]</code>
Schritt 4. Speichern Sie die Daten in der Vektor -Datenbank
Wir erstellen zun?chst eine Klasse namens "Geminiembeddingfunction", mit der die Gemini -Einbettung der API abfragt und den eingebetteten Wert der Eingabebestand zurückgibt. Wir erstellen dann eine Funktion namens "create_chroma_db", um eine Sammlung in Chromadb zu erstellen, die sowohl Daten als auch einbettet.
<code>import chromadb from chromadb import Documents, EmbeddingFunction, Embeddings class GeminiEmbeddingFunction(EmbeddingFunction): def __call__(self, input: Documents) -> Embeddings: title = "Custom query" return client.models.embed_content( model="gemini-embedding-exp-03-07", contents=input).embeddings[0].values def create_chroma_db(documents, name): chroma_client = chromadb.Client() db = chroma_client.create_collection(name=name, embedding_function=GeminiEmbeddingFunction()) for i, d in enumerate(documents): db.add( documents=d.page_content, ids=str(i) ) return db db = create_chroma_db(all_splits, "datab")</code>
Schritt 5. Abfragen Sie die Datenbank ab
<code>def get_relevant_passage(query, db): passage = db.query(query_texts=[query], n_results=1)['documents'][0][0] return passage passage = get_relevant_passage("???? ?????????? ????? ?? ?????? ??????", db) print(passage)</code>
Schritt 6. Vergleiche mit Jina AI Einbettung
Der folgende Code verwendet das Umarmungsgesichts -Transformatormodell, um eine benutzerdefinierte Einbettungsfunktion zu definieren, sowie eine M?glichkeit, die Texteingaben zu verarbeiten, um Einbettungsdings zu generieren.
- Autotokenizer und Automodel von Transformatoren werden verwendet, um vorbereitete Modelle (Jinaai/Jina-Embeddings-V3) zu laden und eine Einbettdingfunktion von Chromadb zur Erstellung von benutzerdefinierten Einbettungen zu importieren.
- Durchschnittsfunktion: Diese Funktion aggregiert die verborgenen Zust?nde des Modells, indem sie Pooling -Operationen auf dem Modell ausführen, durchschnittlich die Sequenzl?nge, w?hrend die Aufmerksamkeitsmaske aufgenommen wird (ignoriert die Füllmarke).
- CustomHuggingFace -Klasse: IT tokenisiert Text, füttert ihn in das Modell und berechnet die Einbettung mit der Funktion AVIDE_POOL. Das Ergebnis wird als eingebettete Liste zurückgegeben.
<code>from transformers import AutoTokenizer, AutoModel from chromadb import EmbeddingFunction tokenizer = AutoTokenizer.from_pretrained('jinaai/jina-embeddings-v3') model = AutoModel.from_pretrained('jinaai/jina-embeddings-v3') # the model returns many hidden states per document so we must aggregate them def average_pool(last_hidden_states, attention_mask): last_hidden = last_hidden_states.masked_fill(~attention_mask[...,None].bool(), 0.0) return last_hidden.sum(dim=1) / attention_mask.sum(dim=1)[...,None] class CustomHuggingFace(EmbeddingFunction): def __call__(self, texts): queries = [f'query: {text}' for text in texts] batch_dict = tokenizer(texts, max_length=512, padding=True, truncation=True, return_tensors='pt') outputs = model(**batch_dict) embeddings = average_pool(outputs.last_hidden_state, batch_dict['attention_mask']) return embeddings.tolist()</code>
Abfrage
<code>def get_relevant_passage(query, db): passage = db.query(query_texts=[query], n_results=1)['documents'][0][0] return passage passage = get_relevant_passage("???? ?????????? ????? ?? ?????? ??????", db) print(passage)</code>
Bei der Auswahl der mehrsprachigen Einbettung von mehrsprachigen E5-Largen ersetzen wir einfach den Tokenizer und das Modell durch "Intfloat/mehrsprachige E5-Large-Instruction".
Vergleich der Einbett -Suchausgabe
Frage Nummer | Abfrage | Gemini einbettet | Jinaai/Jina-Embeddings-V3 | intfloat/mehrsprachig-e5-large-struktur |
1 | ???? ????????? ????? ?? ?????? ?????? | Wenn Sie mehr über die frühen Schwangerschaftssymptome erfahren m?chten, ist dieser Blog -Beitrag perfekt für Sie. Wann sollten Sie einen Schwangerschaftstest haben? -Fehler | Wenn Sie mehr über die frühen Schwangerschaftssymptome erfahren m?chten, ist dieser Blog -Beitrag perfekt für Sie. Wann sollten Sie einen Schwangerschaftstest haben? -Fehler | Wenn Sie mehr über die frühen Schwangerschaftssymptome erfahren m?chten, ist dieser Blog -Beitrag perfekt für Sie. Wann sollten Sie einen Schwangerschaftstest haben? -Fehler |
2 | Schwangerschaft ?? Kuch -Symbole ???? ???? ???? | Was sind die frühen Symptome einer Schwangerschaft? W?hrend der Schwangerschaft treten bei Frauen viele hormonelle Ver?nderungen auf. Frühe Schwangerschaftssymptome sind übelkeit, Erbrechen, h?ufiges Wasserlassen und Müdigkeit, die wir in diesem Blog -Beitrag diskutieren werden. -richtig | Anzeichen einer Schwangerschaft: Vollst?ndige Informationen zu frühen Symptomen! Home Quick Consultation Patient Anmeldeanmeldung Kontaktieren Sie uns: 08062136530 Notfall Telefon: 07340054470 ?ffnen Sie das Hauptmenü, um Patienten und Besucher internationale Patienten über uns zu bedienen, um einen Termin zu vereinbaren, um WhatsApp zurückzurufen, um mehr über die frühen Symptome einer Schwangerschaft zu erfahren. Geburtshilfe und Gyn?kologie | Autor: Dr. CP Dadhich Was sind die frühen Symptome einer Schwangerschaft? Frühe Symptome einer Schwangerschaftsschwangerschaft - Fehler | Was sind die frühen Symptome einer Schwangerschaft? W?hrend der Schwangerschaft treten bei Frauen viele hormonelle Ver?nderungen auf. Frühe Schwangerschaftssymptome sind übelkeit, Erbrechen, h?ufiges Wasserlassen und Müdigkeit, die wir in diesem Blog -Beitrag diskutieren werden. -richtig |
3 | ?????????? ?? ?????? ??????????? ??? ???? ?? ?? ??? ???? | In den ersten Tagen der Schwangerschaft werden Eier und Spermien befruchtet, was Symptome wie Blutungen und Bauchschmerzen verursacht. In dieser Zeit wird Frauen für eine gesunde Schwangerschaft empfohlen, Antibiotika zu vermeiden, da dies für Mütter und Babys gef?hrlich sein kann. Frühe Schwangerschaftssymptome sind nicht immer eine verz?gerte Menstruation oder Erbrechen. Darüber hinaus k?nnen andere Symptome auftreten und besondere Aufmerksamkeit erfordern, z . | In den ersten Tagen der Schwangerschaft werden Eier und Spermien befruchtet, was Symptome wie Blutungen und Bauchschmerzen verursacht. In dieser Zeit wird Frauen für eine gesunde Schwangerschaft empfohlen, Antibiotika zu vermeiden, da dies für Mütter und Babys gef?hrlich sein kann. Frühe Schwangerschaftssymptome sind nicht immer eine verz?gerte Menstruation oder Erbrechen. Darüber hinaus k?nnen andere Symptome auftreten und besondere Aufmerksamkeit erfordern, z . | Was jede Frau wissen sollte. Bei Fragen im Zusammenhang mit schwangerschaftsbezogenen Fragen empfehlen wir Ihnen, sich an unseren Gyn?kologen zu wenden, um alle Komplikationen zu beseitigen. -Fehler |
4 | " | In den ersten Tagen der Schwangerschaft werden Eier und Spermien befruchtet, was Symptome wie Blutungen und Bauchschmerzen verursacht. In dieser Zeit wird Frauen für eine gesunde Schwangerschaft empfohlen, Antibiotika zu vermeiden, da dies für Mütter und Babys gef?hrlich sein kann. Frühe Schwangerschaftssymptome sind nicht immer eine verz?gerte Menstruation oder Erbrechen. Darüber hinaus k?nnen andere Symptome auftreten und besondere Aufmerksamkeit erfordern, z . | In den ersten Tagen der Schwangerschaft werden Eier und Spermien befruchtet, was Symptome wie Blutungen und Bauchschmerzen verursacht. In dieser Zeit wird Frauen für eine gesunde Schwangerschaft empfohlen, Antibiotika zu vermeiden, da dies für Mütter und Babys gef?hrlich sein kann. Frühe Schwangerschaftssymptome sind nicht immer eine verz?gerte Menstruation oder Erbrechen. Darüber hinaus k?nnen andere Symptome auftreten und besondere Aufmerksamkeit erfordern, z . | Was jede Frau wissen sollte. Bei Fragen im Zusammenhang mit schwangerschaftsbezogenen Fragen empfehlen wir Ihnen, sich an unseren Gyn?kologen zu wenden, um alle Komplikationen zu beseitigen. -Fehler |
5 | " | Verz?gerte Menstruation: Dies ist das früheste und h?ufigste Symptom einer Schwangerschaft. Die Best?tigung der Schwangerschaft, die ausschlie?lich auf diesem Symptom beruht, ist nicht vollst?ndig korrekt. Wenn die Menstruation jedoch eine Woche oder l?nger verz?gert wird, werden Schwangerschaftstests empfohlen. Brustver?nderungen: W?hrend der Schwangerschaft schwellen die Brüste an, werden zart oder ver?ndern sich in der Farbe. Es ?ndert sich haupts?chlich in der Gr??e und Farbe der Brustwarze (Areola). -richtig | Wie kann man in diesem Sinne die Schwangerschaft best?tigen? Wie kümmere ich mich um den ersten Monat der Schwangerschaft? Wie mache ich Schwangerschaftsuntersuchungen? Wie soll ich w?hrend der Schwangerschaft sitzen? Sollte Sex w?hrend der Schwangerschaft auftreten? Welche Früchte sollten Sie w?hrend der Schwangerschaft essen? Wie viel Wasser sollten Sie w?hrend der Schwangerschaft trinken? Die Freude, Mutter zu werden, ist das gr??te Glück der Welt. W?hrend der Schwangerschaft gibt es viele Ver?nderungen in den physischen und psychischen Ver?nderungen von Frauen. Sie nennen diese Ver?nderungen frühzeitige Schwangerschaftssymptome - Fehler | Was sind die frühen Symptome einer Schwangerschaft? W?hrend der Schwangerschaft treten bei Frauen viele hormonelle Ver?nderungen auf. Frühe Schwangerschaftssymptome sind übelkeit, Erbrechen, h?ufiges Wasserlassen und Müdigkeit, die wir in diesem Blog -Beitrag diskutieren werden. -richtig |
6 | ??????? ?? ???? ????? ???? ???? ???? | Anzeichen einer Schwangerschaft: Vollst?ndige Informationen zu frühen Symptomen! Home Quick Consultation Patient Anmeldeanmeldung Kontaktieren Sie uns: 08062136530 Notfall Telefon: 07340054470 ?ffnen Sie das Hauptmenü, um Patienten und Besucher internationale Patienten über uns zu bedienen, um einen Termin zu vereinbaren, um WhatsApp zurückzurufen, um mehr über die frühen Symptome einer Schwangerschaft zu erfahren. Geburtshilfe und Gyn?kologie | Autor: Dr. CP Dadhich Was sind die frühen Symptome einer Schwangerschaft? Frühe Symptome einer Schwangerschaftsschwangerschaft - Fehler | Wie kann man in diesem Sinne die Schwangerschaft best?tigen? Wie kümmere ich mich um den ersten Monat der Schwangerschaft? Wie mache ich Schwangerschaftsuntersuchungen? Wie soll ich w?hrend der Schwangerschaft sitzen? Sollte Sex w?hrend der Schwangerschaft auftreten? Welche Früchte sollten Sie w?hrend der Schwangerschaft essen? Wie viel Wasser sollten Sie w?hrend der Schwangerschaft trinken? Die Freude, Mutter zu werden, ist das gr??te Glück der Welt. W?hrend der Schwangerschaft gibt es viele Ver?nderungen in den physischen und psychischen Ver?nderungen von Frauen. Sie nennen diese Ver?nderungen frühzeitige Schwangerschaftssymptome - Fehler | Was sind die frühen Symptome einer Schwangerschaft? W?hrend der Schwangerschaft treten bei Frauen viele hormonelle Ver?nderungen auf. Frühe Schwangerschaftssymptome sind übelkeit, Erbrechen, h?ufiges Wasserlassen und Müdigkeit, die wir in diesem Blog -Beitrag diskutieren werden. -richtig |
7 | " | Die beste Zeit für einen Schwangerschaftstest ist, dass die Menstruation um mindestens 7 Tage verz?gert wird. Sie k?nnen das Home -Schwangerschaftstest -Tool verwenden, um HCG -Werte zu Hause zu erkennen. W?hrend der Schwangerschaft steigt die Spiegel dieses Hormons erheblich an. Eine Sache, die Sie beachten müssen, ist, dass vorzeitige Tests auch zu falschen Ergebnissen führen k?nnen. Wenn sich Ihre Periode verz?gert und der Test negativ ist, wird empfohlen, mindestens 3 weitere Tage zu warten, bevor Sie erneut testen. -richtig | Es gibt auch eine korrekte M?glichkeit, dies zu tun, die Sie auch im Testwerkzeughandbuch sehen k?nnen. Um genaue Ergebnisse zu erzielen, sollten Sie morgens den ersten Urin verwenden, da das korrekte HCG -Hormon gemessen werden kann. Wenn Sie frühe Schwangerschaftssymptome aufweisen und die Testergebnisse negativ sind, sehen Sie Ihren Arzt sofort für einen Bluttest. In jedem Fall müssen Sie einen Arzt konsultieren, wenn Sie Fragen haben. -richtig | Was sind die frühen Symptome einer Schwangerschaft? W?hrend der Schwangerschaft treten bei Frauen viele hormonelle Ver?nderungen auf. Frühe Schwangerschaftssymptome sind übelkeit, Erbrechen, h?ufiges Wasserlassen und Müdigkeit, die wir in diesem Blog -Beitrag diskutieren werden. -Fehler |
erkl?ren
Wie aus der obigen Hindi-Ausgabe ersichtlich ist, erhalten wir unter Verwendung von Gemini-Einbettung 5 korrekte Ausg?nge aus 7 Abfragen, w?hrend wir Jina AI-Einbettung und mehrsprachige E5-Large verwenden, nur 3 korrekte Antworten erhalten.
Dies zeigt, dass Gemini -Einbettungen, wie sich in der MTEB -Benchmark widerspiegelt, gut abschneiden und mehrsprachige wie Hindi besser abwickeln als andere Einbettungsmodelle.
abschlie?end
Kurz gesagt, Gemini -Einbettung stellt einen signifikanten Fortschritt bei mehrsprachiger NLP dar, insbesondere für Hindi -Sprachen wie Hindi. Mit seinen starken mehrsprachigen F?higkeiten, der Unterstützung gro?er Eingangsgr??en und der überlegenen Leistung in Benchmarks wie MTEB Excels in Aufgaben wie Abruf, Klassifizierung und semantische Suche. Durch praktische Vergleiche ist die Leistung von Gemini besser als andere Modelle, was eine h?here Genauigkeit und Effizienz bietet, was es zu einem wertvollen Instrument zur F?rderung mehrsprachiger NLP macht.
Hauptgewinne
- Bedeutung der Hindi-Sprachwort-Einbettung : Eine hochwertige Einbettung verbessert NLP-Aufgaben wie übersetzung, Frage-und-Antwort und Abruf, L?sung von Sprachherausforderungen und Ressourcenlückenproblemen.
- Gemini-Einbettungsmodell : Googles Gemini-Einbettung verwendet sein KI-Framework für die mehrsprachige Textverarbeitung und deckt mehr als 100 Sprachen ab, einschlie?lich Sprachen mit niedrigem Ressourcen.
- Schlüsselmerkmale : Unterstützt 8000 Markierungen und 3072-dimensionale Einbettungen, wodurch eine effiziente Verarbeitung langer Dokumente und komplexer Abfragen erm?glicht wird.
- Beeindruckende Leistung : Rang 1 in der MTEB -mehrsprachigen Rangliste mit einem durchschnittlichen Aufgabenwert von 68,32, der seine Leistung in mehrsprachiger NLP demonstriert.
Die in diesem Artikel gezeigten Medien sind nicht im Besitz von Analytics Vidhya und k?nnen nach Ermessen des Autors verwendet werden.
H?ufig gestellte Fragen
Q1. A: Das Gemini-Einbettungsmodell basiert auf Googles Gemini AI und bietet erstklassige mehrsprachige Texteinbettungen für mehr als 100 Sprachen, einschlie?lich Hindi.
F2. A: Gemini einbettet Excels in mehrsprachige Unterstützung ein, kann 8000 Marker verarbeiten und 3072 Dimensionen ausgeben, um die Effizienz bei der Klassifizierung, Abruf und semantischer Suche zu gew?hrleisten.
F3. Antwort: Gemini Einbettung ist in hochressourcen-Sprachen wie englischen und ressourcenarmen Sprachen wie Assamesisch und Mazedonier gut ab. Es ist die Nummer eins in der MTEB -mehrsprachigen Rangliste und demonstriert die leistungsstarken mehrsprachigen F?higkeiten.
F4. Was ist die Architektur des Gemini -Einbettungsmodells? A: Das Modell wird aus Gemini LLM initialisiert und verwendet eine Transformatorarchitektur mit bidirektionaler Aufmerksamkeit, um hochwertige Texteinbettungen zu erzeugen, die Kontext und Bedeutung erfassen.
F5. Wie wird das Gemini -Einbettungsmodell trainiert? A: Gemini-Einbettung verwendet Verlust (Rauschvergleichssch?tzung) mit negativen Beispielen für das Training. Es durchl?uft zwei Trainingsphasen: Vor-Fine-Einstellung auf einem gro?en Datensatz und aufgabenspezifischen Datens?tzen zur Verbesserung der NLP-Leistung.
Das obige ist der detaillierte Inhalt vonVergleich der Gemini-Einbettung in mehrsprachige E5-Large & Jina. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

Hier sind zehn überzeugende Trends, die die AI -Landschaft der Unternehmen neu ver?ndern. Das riskante finanzielle Engagement für LLMSorganisierungen erh?ht ihre Investitionen in LLM erheblich, wobei 72% erwarten, dass ihre Ausgaben in diesem Jahr steigen. Derzeit fast 40% a

Das Investieren boomt, aber Kapital allein reicht nicht aus. Mit zunehmender Bewertungen und Verblassen der Unterscheidungskraft müssen Investoren in AI-fokussierten Risikokonstrumentfonds eine wichtige Entscheidung treffen: Kaufen, Bau oder Partner, um einen Vorteil zu erlangen? Hier erfahren Sie, wie Sie jede Option bewerten - und PR

Offenlegung: Mein Unternehmen, Tirias Research, hat sich für IBM, NVIDIA und andere in diesem Artikel genannte Unternehmen beraten. Wachstumstreiber Die Anstieg der generativen KI -Adoption war dramatischer als selbst die optimistischsten Projektionen, die vorhersagen konnten. Dann a

Die Kluft zwischen weit verbreiteter Akzeptanz und emotionaler Bereitschaft zeigt etwas Wesentliches darüber, wie sich die Menschen mit ihrer wachsenden Auswahl an digitalen Gef?hrten besch?ftigen. Wir betreten eine Phase des Koexistenz

Diese Tage sind dank AI nummeriert. Suchen Sie den Verkehr für Unternehmen wie die Reisebereich Kayak und das Edtech -Unternehmen Chegg, teilweise, weil 60% der Suchanfragen auf Websites wie Google nicht dazu führen, dass Benutzer laut One Stud auf Links klicken

Reden wir darüber. Diese Analyse eines innovativen KI -Durchbruchs ist Teil meiner laufenden Forbes -S?ulenberichterstattung über die neueste in der KI, einschlie?lich der Identifizierung und Erkl?rung verschiedener wirksamer KI -Komplexit?ten (siehe Link hier). Auf dem Weg zu Agi und

Schauen wir uns genauer an, was ich am bedeutendsten fand - und wie Cisco auf seinen aktuellen Bemühungen aufbauen k?nnte, seine Ambitionen weiter zu verwirklichen.

Haben Sie jemals versucht, Ihr eigenes gro?es Sprachmodell (LLM) zu erstellen? Haben Sie sich jemals gefragt, wie Menschen ihre eigene LLM -Anwendung stellen, um ihre Produktivit?t zu steigern? LLM -Anwendungen haben sich in jedem Aspekt als nützlich erwiesen
