Kolme uutta KÄYTÄ monikielistä moduulia on tulossa TensorFlow-palveluun

Tech / Kolme uutta KÄYTÄ monikielistä moduulia on tulossa TensorFlow-palveluun 2 minuuttia luettu

Google Voice Search



Google on yksi tekoälyn tutkimuksen edelläkävijöistä, ja monet heidän hankkeistaan ​​ovat kääntäneet päätään. AlphaZero Googlen DeepMind joukkue oli läpimurto tekoälyn tutkimuksessa, johtuen ohjelman kyvystä oppia monimutkaisia ​​pelejä itse (ilman ihmisen koulutusta ja puuttumista). Google on myös tehnyt erinomaista työtä Luonnollisen kielen käsittelyohjelmat (NLP), mikä on yksi syy Google Assistantin tehokkuuteen ihmisten puheen ymmärtämisessä ja käsittelyssä.

Google ilmoitti äskettäin julkaisevansa kolme uutta KÄYTÄ monikielisiä moduuleja ja tarjota enemmän monikielisiä malleja semanttisesti samanlaisen tekstin hakemiseksi.



Kaksi ensimmäistä moduulia tarjoavat monikielisiä malleja semanttisesti samanlaisen tekstin hakemista varten, joista toinen on optimoitu hakutehokkuuteen ja toinen nopeuteen ja vähemmän muistin käyttöä varten. Kolmas malli on erikoistunut kysymys-vastaus-haku 16 kielellä (USE-QA) ja edustaa täysin uutta USE-sovellusta. Kaikki kolme monikielistä moduulia koulutetaan a monitoiminen kaksoiskooderin kehys , samanlainen kuin alkuperäinen englanninkielinen USE-malli, samalla kun käytimme tekniikoita, jotka olemme kehittäneet kaksoiskooderi additiivisen marginaalin softmax-lähestymistavalla . Ne on suunniteltu paitsi ylläpitämään hyvää siirto-oppimisen suorituskykyä, myös suorittamaan hyvin semanttiset hakutehtävät.



Kielenkäsittely järjestelmissä on edennyt pitkälle, syntaksipuun jäsentämisestä suurten vektorien assosiaatiomalleihin. Kontekstin ymmärtäminen tekstissä on yksi suurimmista ongelmista NLP-kentässä, ja Universal Sentence Encoder ratkaisee tämän muuntamalla tekstiä korkean ulottuvuuden vektoreissa, mikä helpottaa tekstin sijoittamista ja merkitsemistä.



UTE-merkintärakenteen lähde - Google-blogi

Googlen mukaan ' Kolme uutta moduulia on rakennettu semanttiseen hakuarkkitehtuuriin, joka tyypillisesti jakaa kysymysten ja vastausten koodauksen erillisiksi hermoverkoiksi, mikä tekee mahdolliseksi etsiä miljardien mahdollisten vastausten välillä millisekunneissa. ”Toisin sanoen tämä auttaa tietojen indeksointia paremmin.

' Kaikki kolme monikielistä moduulia koulutetaan a monitoiminen kaksoiskooderin kehys , samanlainen kuin alkuperäinen englanninkielinen USE-malli, samalla kun käytimme tekniikoita, jotka olemme kehittäneet kaksoiskooderi additiivisen marginaalin softmax-lähestymistavalla . Ne on suunniteltu paitsi ylläpitämään hyvää siirto-oppimisen suorituskykyä, myös suorittamaan hyvin semanttiset hakutehtävät . ” Softmax-toimintoa käytetään usein laskentatehon säästämiseen eksponentoimalla vektoreita ja jakamalla sitten jokainen elementti eksponentin summalla.



Semanttinen hakuarkkitehtuuri

'Kaikki kolme uutta moduulia on rakennettu semanttisiin hakuarkkitehtuureihin, jotka tyypillisesti jakavat kysymysten ja vastausten koodauksen erillisiksi hermoverkoiksi, mikä tekee mahdolliseksi etsiä miljardien mahdollisten vastausten välillä. Avain kaksoisenkoodereiden käyttämiseen tehokkaaseen semanttiseen hakuun on koodata kaikki ehdokkaan vastaukset odotettuihin kyselyihin ja tallentaa ne vektoritietokantaan, joka on optimoitu ratkaisemaan lähin naapuri ongelma , jonka avulla suuri joukko ehdokkaita voidaan etsiä nopeasti hyvällä tarkkuus ja palautus '

Voit ladata nämä moduulit TensorFlow Hubista. Katso lisätietoja GoogleAI: n koko sivulta blogipostaus .

Tunnisteet Google