Az AI a webhelyeket valós emberek utánzásával értékeli, sőt még jobban felülmúlja őket. Hogyan történik ez?

Ma az uKit AI, az intelligens weboldal-újratervezési rendszer egyik alkotóeleme nyilvánosságra kerül. Ez egy prototípusmodul a weboldalak szépségének értékelésére. Egyesíti a neurális hálózatot és a döntési fákat, hogy utánozza egy hétköznapi látogató reakcióját a weboldal kialakításához.

A jövőben egy ilyen modul értékelni fogja az uKit AI kulcsfontosságú elemét alkotó generációs tervezési algoritmus munkáját, amely emberi részvétel nélkül oldalakat készít, támaszkodva a rendelkezésre álló tartalomra és a nem hatékony webhely és a nem hatékony webhely közötti különbség „ismeretére” támaszkodva. az egyik az átváltási árfolyam növelésére irányult.

A WebScore AI jelenlegi verziója egy átlagos internetezőnek a webhely megjelenésével kapcsolatos véleményét tükrözi. Bár más lehetőségeket is létrehozhatunk, például felmérhetjük a weboldal használhatóságát.

A rendszer kiképzéséhez használt webhelyek. Mindenekelőtt 12 000 webhelyet és online áruházat gyűjtöttünk össze, amelyek különböző években készültek különböző platformokon és nyelveken. A fő feladat az volt, hogy elegendő vizuális gradációs példát kapjunk, a nagyon rossz webhelyektől a nagyon jó weboldalakig. Ily módon megmutattuk a rendszernek, hogy mi léphet át a modern webben.

Néhány weboldal a képzési mintából.

Minden fokozatot egy skálával mérnek, és ezt a skálát egy közönséges embernek kell értenie, akinek véleményét megpróbáljuk modellezni. Tehát egy ötlettel álltunk elő az 1-től 10-ig terjedő skálára, amelyet szolgáltatásunkban használunk.

Emberek, akiket a WebScore AI utánoz. Két elemre volt szükség az adatkészlet (egy edzési modell adatainak) létrehozásához különféle weboldalakról:

  • azok a jelek, amelyek alapján a rendszer meghatározza, hogy a webhely vonzó-e;
  • a skálánk segítségével elvégzett értékelések (pontok) egy bizonyos webhelyre. Ezek a rendszer modelljévé válnak.

Valaki tegye ezeket a kezdeti értékeléseket. Az ilyen „tanár” vagy „tanárok” csoportja, pontosabban meghatározva, nagymértékben befolyásolja a modell működését.

Weboldalak értékelési felülete: hamarosan vegye át és használja a GitHub-ból.

A fókuszcsoport összegyűjtése érdekében 1500 jelölt weboldalon végeztünk előzetes jelöltek kiválasztását. Rutin munka, de felelősségteljes és nagy figyelmet igényel. Az előzetes kiválasztás segített bennünket a nem megfelelő jelöltek kiküszöbölésében, valamint a „vitatott” (amikor valaki 1-nek, míg a másik 10-et) weboldalaknak a mintából való kizárását.

Eleinte kísérleteztünk az értékelési módszerekkel.

Például felajánlottuk, hogy egy webhelyet egyszerre, majd két webhelyet egyszerre értékel, vagy válasszon a kettő közül a legvonzóbbat. A legjobban működött az a megközelítés, amikor a válaszadó egyetlen weboldalt látott és értékelte. A fennmaradó webhelyek 10 000-es értékeléséhez használtuk.

Az a személy értékelte, hogy a weboldal gyönyörű-e vagy sem. Hogyan fogja ezt a gép csinálni? Önnek és én csak egy pillantásra van szükségünk, hogy véleményt alkossunk valami szépségéről. De tudjuk, hogy az ördög a részletekben van.

A weboldal vizuális vonzerejének jelei, amelyek a modellt irányítják, kulcsfontosságú pillanat az egész projekt számára. Megkérdeztük az uKit weboldal-készítő tervező csapatot, hogy munkájuk alapja százezrek webhelyein, és emberek milliói látják. Együtt összeállítottuk azoknak a szolgáltatásoknak a kibővített listáját, amelyekre a szakemberek odafigyelnek, amikor weblaptervezést dolgoznak ki. Aztán megpróbálta kivágni, csak a legfontosabbat hagyva.

uKit.com tervező csapat.

Ennek eredményeként 125 meglehetősen eltérő, mégis jelentős kritériummal rendelkező ellenőrző listát kaptunk tizenöt kategóriába. Például a lista tartalmazza: alkalmazkodást a népszerű képernyőkhöz, különféle betűméreteket, a színek tisztaságát, a címsorok hosszát, a képek arányát az egész oldalon, és így tovább. Csak annyit kell tennie, hogy kiképezzük a modellt ezeknek a szabályoknak a felhasználásával.

Hozzon létre egy algoritmust. Mi az a „oktatási modell”? Ez egy algoritmus felállítása, amely egy adott tulajdonságkészletre épül és ki tudja értékelni a kiválasztott weboldalt. Kívánatos, hogy a rendszer értékelése és az átlagos tanár értékelése minimális eltérést mutatjon a végső értékelésekben.

Úgy döntöttünk, hogy a gradiensnövelő módszert használja a döntési fák felett, mert ez az egyik legnépszerűbb és leghatékonyabb módszer. Alapvető algoritmusok felhasználásával készít egy halmazt, amelynek teljes eredménye meghaladja bármely külön algoritmus eredményét.

Ezenkívül minden egyes alapvető algoritmus hozzáadásával megpróbálja javítani a teljes készlet válaszai minőségét.

A folyamat felgyorsítása és megkönnyítése érdekében a Yandex CatBoost könyvtárát használtuk, amely lehetővé teszi egy gradiens alapú emlékeztető építését az úgynevezett „feledékeny döntési fákban”, biztosítva a modell jó képzési képességeit a kezdetektől kezdve és a gyors átmenetet az előrejelzések (becslések) biztosításához. ) új objektumokhoz.

Neurális hálózat hozzáadása. Amikor az alap algoritmus elkészült, úgy döntöttünk, hogy kísérletet folytatunk: javulnak-e az eredmények, ha ideghálózatot adunk hozzá? Valójában már tudtuk, hogyan kell „megnézni” egy weboldalt és annak kialakítását, és most úgy döntöttünk, hogy valamilyen „nagyítót” adunk a rendszernek, amelyet felhasználhat még további részletek feltárására.

Az egyik legnépszerűbb hálózatot, a resnet50-et választottuk, amelyet jó algoritmusnak hívnak a magas szintű szolgáltatások kibontására. És megtanultuk, hogyan szerezzen 1000 további attribútumot a webhely értékeléséhez. Ennek eredményeként a rendszer most egy 1125 jellemző alapján jellemzi az URL-t, és 10 pontos skálán találja meg a webhely „helyét”. A folyamat több tucat másodpercig tart, ezért gondolkodunk úgy, hogy felgyorsítsuk a modellt azáltal, hogy csökkentjük a jelek számát, miközben az értékelés minőségét ugyanolyan szinten tartjuk.

Első eredmények. Az így képzett modell háromszor pontosabb becsléseket tudott készíteni az egyes „tanárok” becsléseihez képest.

Azt mondhatjuk, hogy a modell meghaladta első tanárait, mivel a fókuszcsoport becslései jobban különböznek az átlagnál, mint az idegi hálózat becslései. Most behelyezzük az algoritmust a hálózatba a továbbképzés céljából. És te is a tanárá válhat.