Szacuje się, że w polskim Internecie zgromadzonych teraz jest około miliarda polskojęzycznych dokumentów. Dane te porządkują i analizują twórcy polskiej semantycznej wyszukiwarki internetowej Nekst. System pozwolić ma na precyzyjniejsze przeszukiwanie polskich tekstów.

Nad wyszukiwarką pracuje zespół z Instytutu Podstaw Informatyki PAN w Warszawie, a także z Politechniki Wrocławskiej. Badacze chcą do czerwca tego roku zeskanować w sumie 500 mln dokumentów (tekstów - m.in. artykułów czy plików pdf), a więc połowę polskiego Internetu. Wtedy też Nekst ma być udostępniony użytkownikom. Z czasem badacze chcą zeskanować i na bieżąco aktualizować dane o wszystkich polskich tekstach w Internecie.

Więcej przeczytać można na:

Wyszukiwarka Nekst uporządkuje polski Internet.

Szukaj na tym blogu

Caroline World

Polska wyszukiwarka Nekst uporządkuje polski Internet.

Szacuje się, że w polskim Internecie zgromadzonych teraz jest około miliarda polskojęzycznych dokumentów. Dane te porządkują i analizują twórcy polskiej semantycznej wyszukiwarki internetowej Nekst. System pozwolić ma na precyzyjniejsze przeszukiwanie polskich tekstów.

Wyszukiwarka Nekst uporządkuje polski Internet.

Komentarze

Prześlij komentarz

Popularne posty

LinuxLive USB Creator – stwórz bootowalny pendrive z Linuxem

Павел Державин