A Google azt ígéri, hogy a Gmail levelezőrendszere a továbbfejlesztett szövegazonosításnak köszönhetően képes lesz 38 százalékkal hatékonyabban kiszűrni a nemkívánatos üzeneteket, azaz a spameket – írja az Index, a 9to5google.com alapján.
A homoglifák olyan láthatatlan, kétértelmű karakterek, amelyek a valódi betűkkel hasonlatosak. Ezek az elgépelt URL-ek segítik a spamek küldőit, a kiberbűnözőket abban, hogy megkerüljék a Gmail szövegszabályozó modelljeit, így jutva adatokhoz, és továbbítva káros tartalmakat a felhasználóknak.
A RETVek (Resilient & Efficient Text Vectorizer) nevű programot arra fejlesztették ki, hogy „segítse az osztályozó modelleknek az osztályozási teljesítményt elérni”, mialatt „minden nyelvet és minden UTF-8 karaktert támogat, előfeldolgozás nélkül." A Google innovációja a RETVec program segítségével úgy javít az eredményein, hogy egy egyszerű szóbeágyazási modellt használ.
A program segítségével a Gmail-ben az alapszinthez viszonyítva a cég állítása szerint eddig 38 százalékkal javította a spamek felismerési arányát. A Google beszámolója alapján a programot széleskörűen tesztelték az elmúlt évben és elmondható, hogy „rendkívül hatékonynak találták a biztonsági és visszaélési alkalmazásokban".
(Fotó: Ali Balikci / Anadolu Agency via AFP)