środa, 12 lutego 2014

Polska wyszukiwarka Nekst uporządkuje polski Internet.

Szacuje się, że w polskim Internecie zgromadzonych teraz jest około miliarda polskojęzycznych dokumentów. Dane te porządkują i analizują twórcy polskiej semantycznej wyszukiwarki internetowej Nekst. System pozwolić ma na precyzyjniejsze przeszukiwanie polskich tekstów.

Nad wyszukiwarką pracuje zespół z Instytutu Podstaw Informatyki PAN w Warszawie, a także z Politechniki Wrocławskiej. Badacze chcą do czerwca tego roku zeskanować w sumie 500 mln dokumentów (tekstów - m.in. artykułów czy plików pdf), a więc połowę polskiego Internetu. Wtedy też Nekst ma być udostępniony użytkownikom. Z czasem badacze chcą zeskanować i na bieżąco aktualizować dane o wszystkich polskich tekstach w Internecie.



Więcej przeczytać można na:

Wyszukiwarka Nekst uporządkuje polski Internet.

Brak komentarzy:

Prześlij komentarz