2025 Autora: Howard Calhoun | [email protected]. Última modificació: 2025-01-24 13:13
És difícil per a una persona moderna imaginar-se la vida sense Internet i sense accés gairebé instantani a les fonts d'informació. L'usuari rarament pensa en com es duu a terme la cerca del contingut desitjat a la xarxa. Però això és molt interessant.
Un sistema de recuperació d'informació (IPS) és un sistema complex de programari i maquinari que selecciona informació a petició de l'usuari. La informació s'emmagatzema en servidors en format digital, com els llibres solien estar a les prestatgeries de les biblioteques. El sistema consta de molts subsistemes. Cadascú realitza la seva tasca en el procés de tramitació de la sol·licitud de l'usuari i facilitar-li informació en forma de text o sonor. La multiplicitat de tasques a resoldre determina la complexitat de l'arquitectura dels sistemes moderns de recuperació d'informació (abreviatura del sistema de recuperació d'informació). Una mena de "caixa negra": a l'entrada - el text de la sol·licitud, què hi ha dins - es desconeix, a la sortida - informació completa.
Emissions d'entrada
Sol·licituds d'informació que una persona formula en forma de text a la pantalla del seu gadget,constitueixen una petita part de les sol·licituds processades pel cercador. Les principals matrius de consultes de cerca estan formades per robots que accepten una sol·licitud humana i realitzen una cerca i comentaris en diversos passos amb l'usuari. Els sistemes de recuperació d'informació inclouen els coneguts Google, Yandex i altres, que processen milions de sol·licituds diàriament.
Objectes de cerca font
El conjunt d'objectes inicials d'interès per a la cerca són documents, registres, vídeos, imatges i molt més. Es creen fora de l'IPS. El sistema d'emmagatzematge i recuperació d'informació general hauria de tenir un sistema bibliogràfic integrat: una mena de catàleg que us permeti cercar qualsevol tipus d'objecte.
Els objectes o les seves transformacions digitals esdevenen un "recurs d'entrada" a l'IPS. És entre ells on es selecciona la informació que necessita l'usuari.
Fonts externes
La vista de selecció d'informació utilitza fonts de coneixement externes. Aquesta és la informació que busca l'usuari. El títol de la pel·lícula, una cita del llibre i molt més. Per a una cerca informàtica, aquesta informació s'ha de traduir a una consulta en un llenguatge algorítmic. A l'IPS, això es fa mitjançant el bloc per crear, indexar i desenvolupar consultes.
L'ideal és que aquests tres processos (representació, indexació i desenvolupament de consultes) haurien de dependre de fonts de coneixement idèntiques, però a la pràctica, això no és possible.
Les fonts de coneixement s'han de revisar i actualitzar constantment, i l'actualització ha de ser idèntica isincronitzat. I una font externa de coneixement sempre precedeix cronològicament el seu ús als motors de cerca per a una consulta, de vegades per diversos anys.
Actuacions
Les representacions dels objectes originals estan formades per dades d'entrada en alguna combinació o transformades d'acord amb les regles i els algorismes d'un sistema de recuperació d'informació particular.
Les vistes són còpies més o menys transformades de l'objecte de cerca original. A la col·lecció de textos complets sense editar, cada text és la seva pròpia representació. En la col·lecció d'objectes d'exposicions i artefactes del museu, la representació pot ser una descripció transformada de l'objecte amb la seva imatge. En alguns casos, la representació pot derivar en part de l'objecte original i en part de la descripció: en els cercadors bibliogràfics, les representacions es deriven de l'objecte; per exemple, el títol, el nom de l'autor es combinaran amb l'anotació de l'obra.
Índex cercable
Com que la informació en els sistemes de recuperació d'informació s'emmagatzema en forma de representació, és lògic suposar que la cerca es realitza segons la representació i, després de la selecció, es lliura a l'usuari. A la pràctica, aquest no és el cas. Per exemple, els catàlegs actuals de biblioteques en línia solen restringir les cerques a uns quants camps: autor, títol i subtítols dins d'una vista que conté altres camps que no es cerquen. Aquesta és la raó suficient per la qual cal distingiruna vista i un índex cercable, que és la part de cerca de la vista. Defineix tot allò que s'ha de cercar. Un índex de cerca, com ara l'objecte de visualització i font, es pot dividir en subíndexs separats per oferir cerques més precises i orientades
Els motors de cerca solen tenir una estructura sintètica internament per fer coincidir resultats de cerca vàlids. Aquesta estructura és el segon component de l'índex de cerca.
Procedimentalment, el procés d'indexació es pot implementar de diferents maneres: es pot obtenir un índex cercable mitjançant:
- copiant literalment una representació cercable;
- copiant els detalls de la visualització. Això pot ser part o totes les vistes que existeixen físicament només com a fragments, distribuïdes segons les regles per crear un índex per a la cerca, que es recopilarà quan sigui necessari.
Sol·licitud de normes de disseny i sol·licituds formals
L'enginyeria de consultes és una funció que media entre una consulta d'usuari i una consulta formal. Transforma la consulta de l'usuari, fent-la coincidir amb els diccionaris d'ordres de recuperació, l'especificació de l'índex i l'índex abans de la recuperació. En els albors del desenvolupament d'IPS, aquesta funció s'assignava tradicionalment a especialistes informàtics qualificats.
El desenvolupament de consultes d'ordinador que puguin combinar consultes de diccionari en un sistema d'índexs de cerca s'anomena habitualment el mòdul "entrada de diccionari". L'automatització d'aquesta funció és prometedora i ofereix oportunitats per a mètodes de cerca experts i probabilistes.
Una sol·licitud formal es converteix en una sol·licitud formal després que la sol·licitud de l'usuari s'hagi convertit. Alguns exemples d'aquestes transformacions formals inclouen el truncament, la substitució, la normalització, la vectorització i altres transformacions de la representació "externa" a les representacions "internes" de l'IPS de l'ordinador (desxifrat - sistema de recuperació d'informació).
Conjunts d'enllaços de documents extrets
El conjunt de fonts d'informació resultant és lògicament un subconjunt de les vistes creades per les regles de concordança aplicades a la consulta formal mitjançant un índex de cerca.
En general, però no necessàriament, hi ha un procés d'ordenació independent per al conjunt d'informació recuperat. Els catàlegs de biblioteques en línia solen reordenar els conjunts rebuts alfabèticament per autor abans de mostrar-los. En els sistemes de recuperació d'informació que produeixen classificacions estrictes, l'ordre de classificació precedeix qualsevol reordenació.
Transmissions de sortida
La sortida dels resultats de la cerca es fa tradicionalment a la pantalla, més sovint en forma d'un flux d'objectes que s'utilitzaran en altres llocs o per a algun altre propòsit, completa el bucle de cerca principal. Aquests fluxos es poden enviar a dispositius de visualització., emmagatzematge per a un processament posterior o ús com a fluxos d'entrada a altres serveis de selecció.
Els sistemes de recuperació d'informació permeten rebre comentarisla sortida de qualsevol procés de selecció. La sortida de qualsevol procés pot ser retroalimentació a altres processos. Els comentaris poden servir de base per a un judici expert en qualsevol etapa.
Recomanat:
Sistema hidràulic: càlcul, esquema, dispositiu. Tipus de sistemes hidràulics. Reparació. Sistemes hidràulics i pneumàtics
El sistema hidràulic és un dispositiu especial que funciona segons el principi d'una palanca líquida. Aquestes unitats s'utilitzen en els sistemes de frenada d'automòbils, en càrrega i descàrrega, maquinària agrícola i fins i tot en la indústria aeronàutica
Sistemes d'aspiració: càlcul, instal·lació. Producció de sistemes d'aspiració
Els sistemes d'aspiració són sistemes dissenyats per purificar l'aire. L'ús d'aquestes instal·lacions és obligatori a totes les empreses industrials que es caracteritzen per emissions nocives a l'atmosfera
Sistemes Visa i Mastercard a Rússia. Descripció dels sistemes de pagament Visa i Mastercard
Sistema de pagament: un conjunt de mètodes i eines utilitzats per a les transferències de diners, la liquidació i la regulació de les obligacions de deute entre els participants en la facturació econòmica. En molts països, difereixen significativament entre si a causa de les diverses disposicions en els nivells de desenvolupament econòmic i les característiques de la legislació bancària
Sistemes de pagament moderns: ressenyes dels usuaris i valoracions dels millors
Amb la constant promoció activa de les tecnologies modernes, apareixen nous sistemes de pagament, les ressenyes dels quals són diferents. Però, en general, aquests sistemes faciliten i simplifiquen les transaccions financeres. Quins són els millors sistemes de pagament a Internet? TOP-5 dels usuaris habituals de la xarxa
Sistemes corporatius: sistemes de gestió empresarial. Models bàsics
L'article tracta els conceptes de "sistemes de gestió empresarial corporativa" i "sistema de gestió de projectes corporatius". A més, es descriuen els models bàsics de CPMS