martes, 18 de septiembre de 2012

Extractores de información

Buscadores
 Es un programa que aloja una gran bases de datos y se sirve de varios hardwares para poder procesar dicha información. 
Entre los buscadores mas importantes  está
Google por su uso y difusión en la población como buscador,Yahoo se encuentra en el segundo lugar
Bing es otro buscador usado de Microsoft . Ask, AOL, Lycos, altavista, hotbot, excite, etc.


Metabuscadores:
 
Son páginas que usan diferentes buscadores para conseguir información, dicha información es adquirida de los buscadores más importantes.
Ejemplo:

Los metabuscadores más utilizados

•El Buscón es la plataforma de recursos electrónicos de la Biblioteca Nacional que permite el acceso a los recursos electrónicos suscritos opr la Biblioteca Nacional, así como seleccionar estos recursos por materias o tipologías.
•Ixquick es el "buscador más confidencial del mundo" ya que proporciona una navegación anónima que no deja rastro de direcciones IP, ni cookies, ni guarda datos personales...Desde que comenzó a funcionar ha proporcionado 1.200 millones de búsquedas.
•Kartoo es un metabuscador de información que devuelve los resultados de la búsqueda en forma de mapas. Según al relevancia de los sitios encontrados aparecen esferas más o menos grandes. Además se pueden realizar búsquedas vanzadas por temas que se pueden ir ajustando dependiendo los criterios de búsqueda.
•Metacrawler es un metabuscador que ofrece los resultados de las búsquedas de cada buscador utilizado clasificados por columnas. Es una buena forma de diferenciar los resultados.Google, Yahoo, Bing o Ask son algunos de los motores de búsqueda de los que extrae resultados.
•Turbo10 permite una búsqueda en diez buscadores, que el usuario selecciona previamente. Existe un listado de 1.700 buscadores especializados.
•Dogpile es un metabuscador simple y rápido que utiliza motores de búsqueda como About, Ask.com, FinWhat, Bing, Google, LookSmart o MSN Search. Permite búsquedas de información, imágenes y vídeos.
•Mamma devuelve información sobre noticias, imágenes, video e incluso rastrea en Twitter
•Copernic además de un metabuscador es un programa metabuscador cuyo software se instala en el ordenador. Existe una versión gratuita y otra de pago. Entre sus ventajas más relevantes se encuentra el filtrado y la ordenación de los resultados, los criterios de pertinencia propios, posibilidad de salvar y recuperar búsquedas para actualizar resultados.



Directorio:
 
No es un buscador,  es una forma de catalogar la información por tema o contenido.
Ejemplos


Agente inteligente:
Agentes inteligentes
Un sistema multiagente se divide en 3 puntos
a) el tipo de comunicación que realiza
b) El grado de complejidad con la que cuenta el sistema, un ejemplo seria el programa que dtecta el spam de un correo
c) Autonomía: cuan capaz es de realizar por si solo una tarea con la mayor fiabilidad.

Ejemplos de Agentes inteligentes

1) Charlas con representantes virtuales financieros
2) Como asistentes personales:
                Es como tener una persona que continuamente nos dice que hacer de acuerdo a lo que hemos programado para que no se nos olvide
3) Negociador en mercados electrónicos
                Dichos programas localizan subastas en internet, aprende, se retroalimenta con la información obtenida de la subasta y toma la descicion de adquirir, asi como realiza una busqueda sobre las tiendas virtuales para obtener un precio a corde y poder comprar u adquirir, por consiguiente puede subastar tambien el proceso inverso de comprar.
Ejemplos
4) Periodico configurable de Google News
Podemos programar que tipo de noticias podemos leer, catalogando solo la información que nos interesa
5) Sistemas multi-agentes
 si podemos añadir un agente inteligente con otro agente inteligente y que interactuen entre mas de uno podremos generar un multi-agente, ejemplos de multi-agentes

Lista RSS:

Rss es una forma menos compleja de recibir información sin necesidad de ir directamente a la página, es decir se nos despliegan una serie de títulos y nosotros decidimos si deseamos leer mas sobre el tema, RSS se encarga de filtrar información que nos interesa.

jueves, 13 de septiembre de 2012

Operadores booleanos, Posicionales y de exactitud o truncamiento

 
Hay tres tipos de operadores para este fin:
 1. Booleanos
 2. Posicionales
 3. De exactitud o truncamiento
1. Booleanos: es una búsqueda especializada a partir de un sistema lógico desarrollado por el matemático George Boole (1815-64) que consiste en el uso de tres expresiones:
 AND: muestra los enlaces que contienen los dos elementos buscados. Algunos buscadores usan los símbolos + ó & (historia AND argentina)
 OR: el resultado de la búsqueda es mucho más amplia que la anterior pues trae enlaces con uno u otro elemento, suele usarse para unir sinónimos (automóvil OR car)
 NOT: excluye una palabra, puede reemplazarse por los signos - ó !. Hay que tener cuidado pues en algunos buscadores se usa precedido por el AND, mientras que en otros no (Alta Vista: "vino AND NOT rojo", Northern Light: "library NOT university")
 También pueden usarse los paréntesis para realizar búsquedas más complejas: "library AND NOT (university or school)"
2. Posicionales: miden las distancias entre los términos que se intentan localizar.
 NEAR: trae los registros que contiene las dos palabras claves siempre que no superen los 80 caracteres de distancia entre sí.
 FOLLOWED BY: las palabras deben aparecer en el orden en que fueron escritas (no es muy usado).
 PHRASE: se usan comillas para obtener la frase tal cual se ingresó.
 ADJ: trae las dos palabras, una seguida de la otra, sin otros caracteres entre ellas. Se puede escribir ADJ o usar un guión entre las palabras sin dejar espacio.
3. De exactitud o truncamiento: son signos que reemplazan a un carácter o grupo de caracteres, son muy útiles cuando se desconoce el modo correcto de escritura de un término.
 SUBSTRINGS: es el signo que reemplaza a varios caracteres al final de la palabra. Comúnmente se usa el asterisco (*) o el signo pesos ($)
 big* big, bigger, biggest
 COMPLET WORD: esta función se encuentra por defecto en la mayoría de los buscadores, solamente en Lycos se puede agregar un punto (.) al final de la palabra para aclarar que allí termina.

· Uso de minúsculas, mayúsculas y acentos
Como no todos los buscadores e índices diferencian unos de otros, les sugerimos respetar las mayúsculas y los acentos. A continuación incluimos a modo de ejemplo un cuadro en el que representamos los resultados obtenidos en distintos buscadores:
Ejemplo
Terra
A.Vista
Lycos
"Río de la Plata"
-
32.143
23
"río de la plata"
1319
33.902
23
"RIO DE LA PLATA"
122.508
3.210
184.545

 
· ¿Qué puedo hacer con lo que encontré?
Se puede imprimir haciendo uso de la opción que ofrece el programa que opera Internet, se puede grabar en un disquete o como un archivo en el disco rígido, o guardar en Favoritos quedando guardado en un listado dentro del programa operador que permitirá el acceso rápido a la página seleccionada.

· Buscadores especializados
Son los buscadores que se limitan a un tema en concreto, recogen todo sobre lo que de ese tema existe en la red.
 En esta categoría se encuentran los directorios académicos temáticos, generados por universidades, bibliotecas o centros de investigación, cuya característica principal es la alta calidad en los links seleccionados. (por ejemplo
www.uces.edu.ar/campus/biblioteca/listado.php posee links relacionados con las carreras dictadas en la universidad).
 Existen los llamados vortals (nombre que deriva de la contracción de las palabras inglesas vertical portal), estos sitios se focalizan en un tema, tipo de recurso o región geográfica (por ejemplo
www.achoo.com es un sitio dedicado a médicos, www.vortalexperts.com compila vortals dedicados a educación, negocios, arte, salud, medicina, gobierno, historia, medio ambiente, etc.).
 
 
 
 
Google




Búsqueda utilizando operadores booleanos: En Google se puede hacer uso de operadores booleanos que permiten el poder afinar las búsquedas:


Ejemplo de búsqueda
word1 AND word2


 Conector Booleano busca word1 y word2


 word1 OR word2

Conector Booleano busca word1 o word2




·   Uso de comillas: El empleo de comillas se va a utilizar para buscar las palabras exactas o la expresión literal, sino se usan comillas, Google obtendrá los resultados de la combinación de ellas o de cada una de las palabras.


·   Uso del signo menos (-): El signo (-) actúa como el operador NOT, busca términos que contengan la primera palabra pero no la segunda. El signo menos lo que hace es excluir u omitir palabras en la búsqueda. Este signo se colocara delante de la palabra que queremos omitir, sin ningún espacio entre el guion y la palabra, tal como se ve en el ejemplo.


Un ejemplo seria al buscar rojo y menos la palabra azul, no queremos tener búsquedas de youtube entonces añadimos -youtube


 


Obtendremos el resultado deseado


·   Uso de OR (o): Buscan páginas que contengan bien un término u otro.


·   Uso del signo más (+): Al introducir este operador entre palabras, Google nos va mostrar todas las páginas que contengan todas las palabras indicadas.

 

·   Uso de asterisco (*): El asterisco actúa como comodín cuando no se conoce una palabra y así nos puede facilitar la búsqueda. Se emplea con el uso de comillas.


Búsqueda concretas:Además de los operadores booleanos, Google reconoce una serie de comandos, a continuación presentaremos los más útiles:


·     Iphone 5: Google muestra las páginas que contiene en los enlaces los términos de la búsqueda. Así por ejemplo si ponemos en el cuadro de búsqueda iphone 5: precios, Google nos mostrará las páginas que al ser enlazadas contiene los términos de la búsqueda.


·   Cache: Muestra la copia guardada en la cache de Google de una página determinada. Ejemplo:cache:www.buap.mx


 


·   Define: Nos muestra la definición del término buscado.


·   Filetype: limitamos el resultado de nuestra búsqueda a un determinado tipo de archivo. Ejemplo: Filetype: pdf C++


·   Info: Muestra información acerca de un sitio web determinado. Ejemplo: info:www.buap.mx


·   Intext: Nos muestra los textos que contiene el término de búsqueda. Ejemplo: Intext: Iphone5. Lo podemos combinar con la búsqueda habitual de términos.




·   Link: Busca enlaces que se dirigen a un sitio web determinado. Ejemplo: link:www.buap.mx



·   Related: muestra páginas que tiene una temática similar. Ejemplo: related:www.buap.mx


 
·   Site: Limita la búsqueda a un sitio web o a un dominio. Ejemplo: site:www.buap.mx




Búsqueda avanzada


Como hemos dicho anteriormente las búsquedas avanzadas nos van a permitir el poder limitar aun más la búsqueda que queramos realizar.



·   Mostrar resultados: A la hora de mostrar los resultados Google tiene distintas opciones a la hora de realizar la búsqueda, bien:con todas las palabras (en la cual introduciendo las palabras en el cuadro de búsqueda, nos mostrara las páginas que contengan todas las palabras buscadas, pudiendo considerar como la búsqueda que realizamos normalmente, funciona como el operador lógico AND), con la frase exacta (nos va a mostrar páginas que contenga la frase tal y como la hemos escrito en el cuadro de búsqueda. Esta opción equivale a poner el texto entre comillas), con alguna de las palabras (nos va a mostrar páginas que contenga algunas de las palabras que hemos escrito en el cuadro de búsqueda, funciona como el operador lógico OR,y finalmente sin las palabras (nos va a mostrar páginas que no contengan las palabras escritas en el cuadro de búsqueda)


·   Número por página: Nos permite elegir el número de resultados que queremos obtener por página (10, 20, 30, 50 y 100 resultados)


·   Idioma: Podemos elegir el idioma en el que queremos que aparezcan nuestras páginas de búsqueda. Por ejemplo si elegimos el español, las páginas mostradas aparecerán solo en español.


·   Región: Nos permite elegir el país en el cual queremos que muestre la información buscada. Por ejemplo si queremos que la información que buscamos nos muestre las páginas del Reino Unido seleccionaremos este país.


·   Formato de archivo: A partir de dos menús desplegables podemos el tipo de archivo que queremos encontrar. El primer menú desplegable nos permite elegir si solamente queremos ese formato o no.



El segundo menú desplegable nos permite elegir el tipo de archivo que queremos que nos muestre.



Así por ejemplo si seleccionamos “Solamente mostrar resultado en formato Adobe Acrobat PDF (.pdf)”o “No mostrar resultado en formato Miscrosoft Word (.doc)” discriminará los resultados en formato word.


·   Fecha: A partir de un menú desplegable nos permite seleccionar que páginas queremos que se nos muestren en función de determinadas fechas, a partir de la última en la cual fueron actualizadas.


·   Presencia: Nos permite seleccionar a partir de una menú desplegable en que parte de la página queremos que se realice la búsqueda.



·   Dominios: A partir del menú desplegables nos permite el poder discriminar o bien limitar la búsqueda a un dominio o sitio web.


Así por ejemplo, si escribimos www.buap.mx y el cuadro de búsqueda de mostrar resultados escribimos terremotos, solo nos mostrará las páginas que contengan la palabra terremoto y estén en el sitio web que hemos indicado.


·   Derechos de uso: Podemos elegir que los resultados que nos muestre se puedan compartir o modificar.


·   Safe Search: Esta opción nos permite cambiar la configuración del navegador aplicando filtros para evitar contenidos para adultos que aparezcan en los resultados de búsqueda


Búsquedas de imagenes


Una de las opciones de las que dispone Google es la búsqueda de imágenes, tan solo tenemos que hacer clic sobre el vínculo imágenes, automáticamente Google cambia la interfaz, escribiremos en el cuadro de búsqueda la palabra clave asociada a la imagen y pulsaremos sobre “Buscar imágenes”.


Si seleccionamos la imagen posicionándonos sobre ella podemos ver el nombre del archivo y su extensión, tamaño de la pantalla, URL donde se encuentra la imagen, otras similares y más tamaños. Si no encontramos una imagen podemos recurrir a la búsqueda avanzada.


Podemos elegir como queremos que nos muestren los resultados, si bien todas las palabras, bien con la frase exacta, algunas de las palabras o bien con no relacionadas las palabras. El tipo de contenido, tamaño, tamaño exacto, formato, tipo de archivo, coloración, dominios, derechos de uso y Safe Search.


Búsqueda de videos


Google también dispone de la búsqueda de videos, para acceder a la búsqueda de videos seleccionaremos el vínculo de Videos, en el cuadro de búsqueda escribiremos el nombre del video que queramos buscar. Por ejemplo vamos a buscar videos de terremotos. La página dispone de un menú en la parte izquierda que nos va a permitir elegir la web, duración, la ordenación por importancia, la calidad, la fuente, etc.


Si queremos la búsqueda más precisa de un video seleccionaremos la búsqueda avanzada, esta nos va a permitir seleccionar como buscar los resultados, el idioma, la duración, el dominio, si queremos que busque libros con subtítulos, como queremos que aparezcan ordenados los resultados así como los resultados por página.


Búsqueda de libros


Google nos permite localizar un amplio catálogo de libros en una amplia variedad de idiomas de forma sencilla, para acceder a la búsqueda tan solo tenemos que seleccionar el vínculo Más y elegir en el desplegable Libros. Funciona de igual forma que una búsqueda Web, al entrar en la página podemos buscar libros por temas.


 


El objetivo que se persigue con la búsqueda de libros en Google es el de descubrir libros, y no leerlos en línea. Hay algunos libros que tiene restrinciones impuestas (copyright) y limitan el número de páginas que nos muestran, en cambio hay otros en la que los usuarios pueden descargarse la versión en PDF.


También dispone de una búsqueda avanzada la cual nos va a permitir: elegir el modo en el que nos va a mostrar los resultados, donde buscar, el contenido, idioma, título, autor, editor, fecha de publicación, ISBN, ISSN.


Google Académico


Google Académico permite la búsqueda de bibliografía de temas académico de forma sencilla. Podemos localizar libros, documentos, tesis, resúmenes, artículos científicos, material de editoriales de múltiples disciplinas: ciencias, literatura, geografía, etc. Para realizar la búsqueda tan solo tenemos que seleccionar Google Académico que se encuentra en el vínculo; Más. Una vez que hemos accedido a la página escribiremos en el cuadro de búsqueda el título del libro, articulo, manual, etc, que queremos localizar.


Si lo que queremos es buscar documentación de una determinada disciplina, escribiremos en el cuadro de búsqueda el nombre de la disciplina académica y Google Académico nos mostrará los resultados. Para afinar la búsqueda podemos utilizar los operadores antes mencionados o recurrir a la búsqueda avanzada.



Google Académico también dispone de una Búsqueda avanzada que nos va a permitir el poder acotar los resultados.



La búsqueda avanzada de Google Académico nos va a permitir: Buscar artículos, bien con todas las palabras, con la frase exacta, con al menos una de las palabras, sin las palabras, donde las palabras aparezcan, de la misma forma que la búsqueda en la web. Podemos hacer uso de las comillas. Autor: con frecuencia para localizar una obra, artículo, etc, recurrimos a la búsqueda mediante el autor, para localizar dicho documento mediante el autor escribiremos el nombre del autor entre comillas incluso también podemos usar iniciales para realizar la búsqueda. Podemos también realizar la búsqueda escribiendo el nombre de donde ha sido publicados o bien el año de su publicación. También nos permite configurar el número de resultados que queremos que aparezcan por página.


Tiempo Real


El tiempo real de Google nos ofrece resultados actuales de nuestra búsqueda procedentes de una gran variedad de fuentes: redes sociales (Twitter, Facebook, etc), Blogs, etc. Podemos filtrar el resultado según el lugar además de poder ver conversaciones completas.


Bibliografías:
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_buscadores/buscadores.htm