J.D.Blanco, X.Bohigas, X.Jaén y M.Novell
(JDBlanco@teleline.es, Xavier.Jaen@upc.es, Montse.Novell@upc.es, Xavier.Bohigas@upc.es)
Departament de Física i Enginyeria Nuclear, Universitat Politècnica de Catalunya
Av. Diagonal, 647, ETSEIB planta 6. 08028 Barcelona
Se presenta un buscador de Internet, realizado por los autores, especializado en la gestión de información útil en campos de conocimiento previamente seleccionados. El profesor usuario cuenta con unas herramientas para clasificar la información de la red que crea conveniente mostrar. El estudiante usuario tiene una interfície adecuada a sus necesidades para encontrar aquellos contenidos que le son necesarios.
Palabras clave: Internet, educación, buscador
Necesidad de un buscador educativo
Los grandes buscadores existentes en Internet ( YAHOO, LYCOS, ALTAVISTA...)[1] tienen un carácter marcadamente comercial y realizan búsquedas indiscriminadas. Estos han marcado la estructura de funcionamiento de otros buscadores dentro del campo de la educación. Los resultados de una búsqueda suelen ser desalentadores para cualquier usuario.
Un buscador educativo debería ser esencialmente un buscador de contenidos de carácter cultural. La búsqueda de contenidos culturales no tiene por qué estar ligada a unas pautas preconcebidas. Este es el problema que encuentran los realizadores de índices de las enciclopedias convencionales [2]. Un ítem cultural puede interesar desde muchos puntos de vista.
Pongamos un ejemplo. Si vamos a una agencia de viajes para contratar unas vacaciones la persona o interfície que nos atienda nos preguntará una serie de cuestiones pautadas, en las que hay una clara jerarquía. Por ejemplo
1) ¿Dónde quiere ir?
2) ¿Cuantos días?
3)¿Barco avión?
4)¿Tipo de hotel?
......................
Seria extraño (no imposible desde el punto de vista lógico) empezar preguntando 4) y seguidamente 1). En cambio cuando a lo que se quiere acceder es a conocimiento será en general difícil saber desde donde parte y que conocimientos previos tiene el usuario. ¡Es posible que incluso no tenga muy claro lo que esta buscando! Así aunque el conocimiento se puede organizar jerárquicamente el acceso a este no tiene por qué seguir una pauta predefinida y jerárquica.
Los buscadores que gestionan el acceso a las páginas web funcionan en general por palabras clave. El usuario debe escribir aquellos tópicos que desea buscar. Se le permite utilizar algunos conectores lógicos (AND, OR). Aprieta el botón de búsqueda y el buscador le proporcionará una lista de direcciones web dónde aparecen escritos los tópicos definidos por el usuario. No hay un control del contexto en que aparecen los tópicos en cada documento. Tampoco hay un control de calidad de algún tipo que garanticen la veracidad de lo que se dice en las páginas encontradas. Pero además muchas veces el resultado de la búsqueda es desalentador por la enorme cantidad de páginas web que hacen referencia, de una u otra forma, a los tópicos buscados. Existen además otros tipos de dificultades como la imposibilidad de realizar búsquedas independientes del idioma...
Recientemente los buscadores citados ( YAHOO, LYCOS..) han empezado a ofrecer a sus usuarios páginas preseleccionadas por personal cualificado ( personal humano!) reducidas en número y organizadas jerárquicamente en forma de árbol de directorios. Así si un usuario esta interesado en encontrar información sobre gatos puede acceder a ella a través de la cadena
....Ciencias>Biologia>Zoologia>....
¡Es muy posible que el interés por los gatos no parta de un punto de vista biológico!
Pero si se ha seguido la cadena correctamente aun así habrá que buscar en una lista de direcciones, ahora reducida pero que va creciendo día a día, la palabra gato.
Este tipo de dificultades junto con la reflexión general que cada ámbito social, en general y educativo en particular, tiene sus necesidades, nos ha llevado a la conclusión que es necesario contar con algún tipo de software que gestione la información que aparece en Internet, y que la interfície que lo implemente debe tener algunas características específicas e irrenunciables.
El buscador que se ha desarrollado parte de los siguientes principios básicos:
Hay intervención humana (racional) en el material susceptible de ser buscado:
El paquete de contenidos que se ofrece al grupo usuarios debe ser seleccionado por personas que conozcan la finalidad que se le va a dar. No tiene sentido, por ejemplo, ofrecer miles de páginas de ciencias naturales a niños de 10 años, puesto que el exceso de información irá posiblemente en contra del interés por el tema. Se podrán aplicar criterios pedagógicos y cognitivos en la cantidad y calidad del material ofertado.
La catalogación del material a ser buscado se hace por medio de palabras y frases clave:
Una vez se tienen las direcciones de las páginas que se van a ofertar al grupo de usuarios estas deben ser catalogadas. La catalogación es un proceso que involucra el contenido real de la página y no las palabras que aparecen escritas en ella, que puede realizar el mismo profesor usuario. Una página en la que aparezca la palabra mosca seis veces en 10 líneas puede en realidad no estar en absoluto hablando de moscas si no, por ejemplo, de la trayectoria de las partículas en general... También puede ocurrir que al estudiante usuario le interese buscar páginas que hablen de "mosca" pero sin restringirse a un idioma concreto ( catalán, castellano, gallego, euskera, inglés francés...). Así parece claro que uno o varios especialistas en el tema que se este tratando especifiquen de que se habla en realidad en esta u otra página independientemente de las palabras concretas utilizadas en ella.
La idea de palabra clave es buena, aunque poco estructurada. Hemos creído conveniente ampliarla a frase clave. Una frase clave es la unión de dos o más palabras clave. Por ejemplo [ley, newton] es un ejemplo de frase clave construida a partir de las palabras clave ley y newton. Podemos así tener otras frases similares como [ley, coulomb] ,[unidad,newton]... etc. Este mecanismo hace que el sistema asocie de una forma automática unas palabras con otras.
Así pues finalmente el profesor usuario que cataloga la información asociará a cada dirección web una serie de frases clave que identificarán a la página en cuestión.
El estudiante usuario no tiene por qué saber que palabras clave utilizar para tener éxito en una búsqueda:
Esta es una cuestión de crucial importancia. Un buscador de contenidos culturales no puede pretender que el usuario sea un experto en el tema. El estudiante usuario, es guiado por el buscador en esta tarea. El buscador ofrece en cada momento al estudiante usuario posibles palabras o frases clave a utilizar en el proceso de búsqueda. El propio proceso de búsqueda se convierte así en una fuente de conocimiento.
El resultado de la búsqueda da información complementaria acerca del contenido del documento encontrado:
Una vez concluido un proceso de búsqueda el resultado será una lista más o menos extensa de direcciones web. El buscador dará al estudiante usuario una mínima información relativa a cada página encontrada e independiente de las palabras contenidas en la página, de manera que él pueda decidir por que página le interesa navegar.
Todo el proceso de búsqueda, hasta la adquisición final del documento, se puede realizar desconectado de la red:
Todo proceso de búsqueda puede requerir diferentes grados de interacción entre el usuario y el buscador ( software, bases de datos...). Habitualmente ello se traduce en un elevado grado de interacción entre el PC-cliente y el servidor (que es donde reside el software y las bases de datos), que ralentizan mucho el proceso de búsqueda. En nuestro caso todo el proceso de búsqueda se realiza en el PC-cliente de manera que pueda incluso realizar búsquedas sin estar necesariamente conectado a la red. El buscador que proponemos esta implementado en Java de manera que es un simple applet que se inserta fácilmente en una página web escrita en HTML. Digamos que el código pesa unos 100 kb y que la base de datos, generada por el propio sistema, para unas 2000 páginas puede pesar muy por debajo de los 50 kb y aún podría ser troceada en diversos archivos.
Como hemos comentado la implementación del buscador propuesto esta hecha en Java. Así garantizamos la independencia de la plataforma y la posibilidad que funcione como applet en el PC cliente [3]. En la realización se distinguieron 3 partes.
La interfície del buscador:
En esta hay la presentación pública de palabras y frases clave en botones y persianas que economizan al máximo el impacto visual y permiten avanzar fácilmente en la adquisición de la información.

Aquí podemos ver la interfície del buscador con algunas persianas activadas y donde se ha iniciado una búsqueda. Al escoger la palabra ley se sugieren otras que completan una frase. El estudiante usuario puede escoger entre estas y completar así la frase o ignorarlas escogiendo otras posibilidades o , como se ha hecho en este caso dar por terminada la operación y proceder a la búsqueda. En la ventana inferior aparece el resultado de la búsqueda. Cada documento encontrado aparece junto con las frases completadas, correspondientes a las palabras o frases utilizadas en la búsqueda.
Cada palabra clave tiene una representación interna y una representación pública. Así por ejemplo la palabra clave cuya representación interna es centrodemasas tiene una representación pública que es Centro de masas de esta forma el estudiante usuario ve las palabras en su forma habitual. Puede escoger las palabras clave Centro de masas, N , particula/s y formar la frase [Centro de masas, N , particula/s].
El conjunto de palabras clave puede llegar a ser enorme, incluso un numero mayor que el numero de documentos catalogados. Esto es normal que pase pues queremos que cada documento pueda ser visto desde muchos puntos de vista.
Todas las palabras clave están previamente definidas y se les asigna una jerarquía que ayuda al estudiante usuario ( pero no impone) en el proceso de búsqueda. Observando la figura, si tenemos marcada la palabra "Electromagnetisme" aún que no la escojamos como palabra a ser buscada (esto es, no la insertemos en la ventana superior), las persianas de palabras que quedan a su derecha quedaran automáticamente filtradas dejándonos ver solo palabras que estén junto con "Electromagnetisme" como descriptores de documentos. De esta manera, un usuario poco familiarizado con "Electromagnetisme" le será más fácil escoger palabras que tengan relación con este en lugar de tener que inventar palabras (que puedan aparecer en los documentos) relacionadas con su búsqueda. A este mecanismo se le añade el de las frases, que viene a ser una adaptación de la jerarquía general de palabras al tema concreto que se este buscando. Las frases pueden relacionar palabras jerárquicamente muy alejadas.
En este sentido el buscador ejerce en el mismo proceso de búsqueda una evidente labor didáctica.
El editor de palabras clave:
Es una utilidad para el profesor usuario del buscador en el proceso de catalogación de los documentos susceptibles de ser buscados. La interfície es parecida a la del buscador. Así el profesor usuario va construyendo la cadena de palabras y frases clave que asigna a una dirección determinada a partir de menús previamente definidos.
Los ficheros de configuración:
Permiten al profesor usuario la correcta adaptación del editor y buscador al uso específico deseado ( área de conocimiento, bloque temático, asignatura...). Hay tres tipos de ficheros de configuración.
El primero es de hecho la propia página HTML donde se ha insertado el applet. A través de una serie de parámetros se pueden escoger diferentes formas de funcionar y/o adaptar la interficie al idioma deseado (simplemente se reescriben los rótulos de los diferentes botones "Nova cerca" " Esborrar" " Refinar"... etc. (ver figura) en la forma que se desea.
El segundo esta formado por un fichero, que puede ser editado fácilmente usando un editor del tipo MSWord y sus facilidades para tratar tablas, en el que se declaran todas las palabras clave que se van a utilizar junto con sus características: Representación pública, jerarquía principal (a que persiana pertenece) y jerarquía secundaria (orden en el que aparece dentro de su persiana en el caso que el alfabético no sea el conveniente). Antes hay que declarar en el mismo documento las diferentes persianas también con su jerarquía (determina si la persiana aparece mas o menos a la derecha). Este documento es acumulativo. No es necesario declarar TODAS las palabras de una vez. Se pueden ir añadiendo a medida que se incluyen nuevos documentos a ser buscados y que ello requiera la utilización de nuevas palabras clave.
Finalmente el tercer fichero de configuración es el fichero donde figuran las direcciones web junto con las palabras clave que las describen. El aspecto que tiene este fichero es:
.
.
http://www.tictac.jp/aschu/pipa.html#muma
Aunque esta en japonés tiene unas imágenes muy buenas sobre moscas
biologia,zoologia,[,mosca,volar,],[mosquito,nutricion,]...
http://.....
.
.
.
Como vemos está formado por conjuntos de tres filas. La primera es la dirección web. La segunda es un comentario escueto sobre la página que aparecerá en la ventana correpondiente del buscador junto con la dirección web y las frases completadas como resultado de una búsqueda. Finalmente la tercera esta formada por las palabras y frases clave.
[1] http://www.yahoo.com[2] IMS Project: http://www.imsproject.org/technical/metadata
Enciclopaedia Britannica: http://www.eb.com
[3] la baldufa: http://baldufa.upc.es/baldufa/buscador/buscadorlocal.html
|
|