IPS és Propòsit i funcions dels sistemes de recuperació d'informació

Taula de continguts:

IPS és Propòsit i funcions dels sistemes de recuperació d'informació
IPS és Propòsit i funcions dels sistemes de recuperació d'informació

Vídeo: IPS és Propòsit i funcions dels sistemes de recuperació d'informació

Vídeo: IPS és Propòsit i funcions dels sistemes de recuperació d'informació
Vídeo: How to repair portable generator part 1 of 3 2024, Abril
Anonim

És difícil per a una persona moderna imaginar-se la vida sense Internet i sense accés gairebé instantani a les fonts d'informació. L'usuari rarament pensa en com es duu a terme la cerca del contingut desitjat a la xarxa. Però això és molt interessant.

Un sistema de recuperació d'informació (IPS) és un sistema complex de programari i maquinari que selecciona informació a petició de l'usuari. La informació s'emmagatzema en servidors en format digital, com els llibres solien estar a les prestatgeries de les biblioteques. El sistema consta de molts subsistemes. Cadascú realitza la seva tasca en el procés de tramitació de la sol·licitud de l'usuari i facilitar-li informació en forma de text o sonor. La multiplicitat de tasques a resoldre determina la complexitat de l'arquitectura dels sistemes moderns de recuperació d'informació (abreviatura del sistema de recuperació d'informació). Una mena de "caixa negra": a l'entrada - el text de la sol·licitud, què hi ha dins - es desconeix, a la sortida - informació completa.

Fitxer de targetes a la vida real
Fitxer de targetes a la vida real

Emissions d'entrada

Sol·licituds d'informació que una persona formula en forma de text a la pantalla del seu gadget,constitueixen una petita part de les sol·licituds processades pel cercador. Les principals matrius de consultes de cerca estan formades per robots que accepten una sol·licitud humana i realitzen una cerca i comentaris en diversos passos amb l'usuari. Els sistemes de recuperació d'informació inclouen els coneguts Google, Yandex i altres, que processen milions de sol·licituds diàriament.

Objectes de cerca font

El conjunt d'objectes inicials d'interès per a la cerca són documents, registres, vídeos, imatges i molt més. Es creen fora de l'IPS. El sistema d'emmagatzematge i recuperació d'informació general hauria de tenir un sistema bibliogràfic integrat: una mena de catàleg que us permeti cercar qualsevol tipus d'objecte.

Els objectes o les seves transformacions digitals esdevenen un "recurs d'entrada" a l'IPS. És entre ells on es selecciona la informació que necessita l'usuari.

Cerca informació
Cerca informació

Fonts externes

La vista de selecció d'informació utilitza fonts de coneixement externes. Aquesta és la informació que busca l'usuari. El títol de la pel·lícula, una cita del llibre i molt més. Per a una cerca informàtica, aquesta informació s'ha de traduir a una consulta en un llenguatge algorítmic. A l'IPS, això es fa mitjançant el bloc per crear, indexar i desenvolupar consultes.

L'ideal és que aquests tres processos (representació, indexació i desenvolupament de consultes) haurien de dependre de fonts de coneixement idèntiques, però a la pràctica, això no és possible.

Les fonts de coneixement s'han de revisar i actualitzar constantment, i l'actualització ha de ser idèntica isincronitzat. I una font externa de coneixement sempre precedeix cronològicament el seu ús als motors de cerca per a una consulta, de vegades per diversos anys.

Sistema de recuperació d'informació
Sistema de recuperació d'informació

Actuacions

Les representacions dels objectes originals estan formades per dades d'entrada en alguna combinació o transformades d'acord amb les regles i els algorismes d'un sistema de recuperació d'informació particular.

Les vistes són còpies més o menys transformades de l'objecte de cerca original. A la col·lecció de textos complets sense editar, cada text és la seva pròpia representació. En la col·lecció d'objectes d'exposicions i artefactes del museu, la representació pot ser una descripció transformada de l'objecte amb la seva imatge. En alguns casos, la representació pot derivar en part de l'objecte original i en part de la descripció: en els cercadors bibliogràfics, les representacions es deriven de l'objecte; per exemple, el títol, el nom de l'autor es combinaran amb l'anotació de l'obra.

Trobar el que necessites
Trobar el que necessites

Índex cercable

Com que la informació en els sistemes de recuperació d'informació s'emmagatzema en forma de representació, és lògic suposar que la cerca es realitza segons la representació i, després de la selecció, es lliura a l'usuari. A la pràctica, aquest no és el cas. Per exemple, els catàlegs actuals de biblioteques en línia solen restringir les cerques a uns quants camps: autor, títol i subtítols dins d'una vista que conté altres camps que no es cerquen. Aquesta és la raó suficient per la qual cal distingiruna vista i un índex cercable, que és la part de cerca de la vista. Defineix tot allò que s'ha de cercar. Un índex de cerca, com ara l'objecte de visualització i font, es pot dividir en subíndexs separats per oferir cerques més precises i orientades

Els motors de cerca solen tenir una estructura sintètica internament per fer coincidir resultats de cerca vàlids. Aquesta estructura és el segon component de l'índex de cerca.

Procedimentalment, el procés d'indexació es pot implementar de diferents maneres: es pot obtenir un índex cercable mitjançant:

  • copiant literalment una representació cercable;
  • copiant els detalls de la visualització. Això pot ser part o totes les vistes que existeixen físicament només com a fragments, distribuïdes segons les regles per crear un índex per a la cerca, que es recopilarà quan sigui necessari.
Gestió de cerca
Gestió de cerca

Sol·licitud de normes de disseny i sol·licituds formals

L'enginyeria de consultes és una funció que media entre una consulta d'usuari i una consulta formal. Transforma la consulta de l'usuari, fent-la coincidir amb els diccionaris d'ordres de recuperació, l'especificació de l'índex i l'índex abans de la recuperació. En els albors del desenvolupament d'IPS, aquesta funció s'assignava tradicionalment a especialistes informàtics qualificats.

El desenvolupament de consultes d'ordinador que puguin combinar consultes de diccionari en un sistema d'índexs de cerca s'anomena habitualment el mòdul "entrada de diccionari". L'automatització d'aquesta funció és prometedora i ofereix oportunitats per a mètodes de cerca experts i probabilistes.

Una sol·licitud formal es converteix en una sol·licitud formal després que la sol·licitud de l'usuari s'hagi convertit. Alguns exemples d'aquestes transformacions formals inclouen el truncament, la substitució, la normalització, la vectorització i altres transformacions de la representació "externa" a les representacions "internes" de l'IPS de l'ordinador (desxifrat - sistema de recuperació d'informació).

Conjunts d'enllaços de documents extrets

El conjunt de fonts d'informació resultant és lògicament un subconjunt de les vistes creades per les regles de concordança aplicades a la consulta formal mitjançant un índex de cerca.

En general, però no necessàriament, hi ha un procés d'ordenació independent per al conjunt d'informació recuperat. Els catàlegs de biblioteques en línia solen reordenar els conjunts rebuts alfabèticament per autor abans de mostrar-los. En els sistemes de recuperació d'informació que produeixen classificacions estrictes, l'ordre de classificació precedeix qualsevol reordenació.

Anàlisi de dades
Anàlisi de dades

Transmissions de sortida

La sortida dels resultats de la cerca es fa tradicionalment a la pantalla, més sovint en forma d'un flux d'objectes que s'utilitzaran en altres llocs o per a algun altre propòsit, completa el bucle de cerca principal. Aquests fluxos es poden enviar a dispositius de visualització., emmagatzematge per a un processament posterior o ús com a fluxos d'entrada a altres serveis de selecció.

Els sistemes de recuperació d'informació permeten rebre comentarisla sortida de qualsevol procés de selecció. La sortida de qualsevol procés pot ser retroalimentació a altres processos. Els comentaris poden servir de base per a un judici expert en qualsevol etapa.

Recomanat: