Wetenschap17 oktober 2000

Site Analist versterkt RDNet-Plus

Het RDNet-Plus groeit gestaag. Maar toch niet hard genoeg, naar de zin van velen. Een nieuw computerprogramma moet meer schot in de zaak brengen én maakt de kans op fouten kleiner. Sinds enkele weken gebruikt het RD daarvoor het speciaal ontwikkelde softwarepakket Site Analist.

Sinds RDNet-Plus in gebruik genomen is, precies een jaar geleden, zijn er meer dan 2500 internetsites toegelaten. Dat lijkt niet zo veel, maar er zitten heel wat sites tussen die vele tienduizenden pagina's tellen. Toch hebben de abonnees van RDNet-Plus nog niet tot al deze sites toegang, omdat ze niet allemaal in het rubriekensysteem opgenomen zijn.

„Bovendien is het zoeken naar informatie lastig, omdat een zoekmachine tot nu toe ontbrak”, zegt R. A. Hertog, projectleider digitale media bij het RD. „Zoekmachines die op het hele internet zoeken, zijn makkelijk te vinden, maar een zoekmachine die alleen in toegelaten sites zoekt, bestond nog niet. Daarom hebben we in mei opdracht gegeven aan het Zwolse automatiseringsbedrijf Aecis om voor ons het programma Site Analist te bouwen.”

Site Analist is niet alleen een zoekmachine, maar tegelijkertijd een hulpmiddel voor het screenen van internetsites. Het RD gaat binnenkort leden werven voor een community die met behulp van Site Analist meewerkt aan het uitbouwen van RDNet-Plus. Bovendien gaat ook de onderwijscommunity van RFI gebruikmaken van Site Analist en worden de sites van deze community aan RDNet-Plus toegevoegd.

Rubricering
Hertog: „Site Analist ontleedt een internetsite en maakt een lijst van alle pagina's, plaatjes, video's en geluidsfragmenten die op de site te vinden zijn. Dat gaat relatief snel: een doorsnee site is in een paar minuten gebeurd. Het voordeel van zo'n lijst is dat je geen enkel onderdeel van de site overslaat. De coördinator van de community beoordeelt dan wat er mee moet gebeuren en stuurt de site zo nodig door naar een van de screeners. Hij heeft een overzicht van de screeners, weet wat hun kennisgebieden zijn, welke talen ze beheersen en hoeveel tijd ze beschikbaar hebben. De screener krijgt de lijst voor zich, hoeft de verschillende hyperlinks alleen maar aan te klikken, en beoordeelt alle onderdelen. Per pagina of plaatje kan hij aangeven wat wel of niet toegelaten dient te worden, maar de screener moet altijd aangeven waarom hij iets afwijst.”

Elke toegelaten site komt terecht in een digitaal gegevensbestand, een database. Daardoor is het mogelijk om binnen de toegelaten onderdelen te zoeken. Tegelijkertijd vraagt het programma in welke rubriek(en) de site thuishoort: theologie, reizen, kunst, onderwijs, gezondheid. De indeling ervan is inmiddels sterk verfijnd, tot zes lagen diep. Zo maakt het programma onderscheid tussen cateringbedrijven, partycentra en pizzeria's, of tussen houtzagerijen en houtbewerkingsmachines.

De groei van RDNet-Plus heeft intussen wel geleden door al het werk dat in de afgelopen maanden aan Site Analist verricht is, geeft Hertog toe. De 10.000 sites voor het eind van het jaar –de doelstelling die directeur ing. J. Koetsier dit voorjaar presenteerde– zal dan ook niet gehaald worden. Hertog: „Maar we hopen straks met de twee community's die achterstand snel in te halen.”