CaFe.pm - Perl Mongers de Capital Federal
http://cafe.pm.org/


Review de "** Google Hacks 2nd. Edition **"

por ** Marcelo A. Liberatto A.K.A. N3krodamus ** (** marceloliberatto@gmail.com **)


Autor: ** Tara Calishain & Rael Dornfest **
Editorial: ** Oreilly **
ISBN: ** 0-596-00857-0 **



Introducción

Debo decir que al encontrarme con este libro pense "¿Un libro entero sobre un buscador en internet?", simplemente no podia pensar en como rellenar las casi 500 paginas de este libro. Sin embargo asi como Google no es solo un buscador, este libro tampoco es solo un libro acerca de un buscador; desde su aparición la misión de Google ha sido organizar la información y hacerla universalmente accesible y útil. Esto no es poca cosa y, apesar de su austera apariencia, Google tiene mucho mas para ofrecer que un simple buscador y por supuesto este libro no es solo un libro acerca de un buscador.
La documentación aqui presentada nos enseñará todo lo referente a la sintáxis del buscador propiamente dicho para luego ir conociendo otros servicios del mismo, en capitulos mas avanzados, veremos como utilizar la API de Google para nuestros propios "buscadores" con ejemplos desarrollados en Python, PERL, PHP y Java.
Cabe tambien aclarar que muchos de los servicios que google tiene disponibles y que son tratados en este libro desgraciadamente no estan accesibles para todo el mundo, pero no dejan de ser impresionantes y estan bien cubiertos y explicados por este libro.

Capítulo 1 - WEB

Este capítulo nos da la introducción a lo que es el buscador Google y su sintáxis, permitiendonos conocer ciertos trucos para optimizar mejor nuestras busquedas. Vemos algunas de las cualidades especiales del buscador como por ejemplo la calculadora, la agenda telefonica, los links de "En cache", "Páginas similares" y "Voy a tener suerte". Con ejemplos de busquedas comunes el autor nos muestra como mejorarlas para obtener un maximo aprovechamiento de la palabras ingresadas, ya que siempre tenemos un limite de 10 por búsqueda. Vemos también como realizar busquedas en distintos lenguajes y como acomodar la interface de Google para buscar en nuestro propio idioma; una mención especial aqui hay que hacerle a la interface en idioma Klingon (!?). ¿Quién dijo que los programadores de Google eran geeks?... Aqui se confirma; eso si es mejor tener un diccionario Klingon-Español cerca. Mas adelante vemos como utilizar el diccionario implicito en el buscador y como realizar busquedas con terminos tecnicos propios de una disciplina en particular, vemos tambien como utilizar la agenda telefonica para realizar busquedas de numeros de telefono para luego cruzar la información con los mapas de la región que nos encontremos, esto por desgracia solo es válido para E.E.U.U..

Capítulo 2 - Advanced WEB

Aqui se avanza mas profundamente sobre el buscador de Google pero esta vez desde el punto de vista de la API, se nos muestra como trabajar con las busquedas para recombinar resultados, buscar dentro de un sitio en particular y manipular los resultados obtenidos, todo esto desde un script o como dice al principio del capítulo "sin utilizar los dedos". Este capítulo tiene una gran cantidad de scripts, en distintos lenguajes, para realizar distintas tareas mas o menos utiles; para quienes sean mas novatos en el area de programación cada ejemplo tiene una breve explicación de como ejecutar el script en nuestro equipo. Estos programas son sencillos scripts, que realizan tareas simples que seria bastante tedioso de realizar si no se utilizara un script que automatizara la tarea. Se nota especialmente el porqué del título del libro "Google hacks" ya que son eso definitivamente, pequeños trucos que realizan una tarea especifica. Cabe aclarar que no es necesario leerlos en un orden correlativo ya que no guardan una relación entre sí. Los lenguajes que se utilizan aqui son PERL, Python y PHP siendo mayoritariamente utilizado PERL. En todos los casos se explica el "hack" y luego se sigue con una pequeña sección "Hacking the hack" que nos explica como hizo el autor para mejorar el script para que desarrolle una tarea un poco mas compleja.

Capítulo 3 - Images

Este es un capítulo es breve y se dedica exclusivamente a la búsqueda de imágenes en la web utilizando el buscador de Google. Nos explica la sintaxis del mismo para relizar busquedas de imágenes y algunos trucos que nos ayudaran a encontrar lo que buscamos, tengamos en cuenta que se cuentan alrededor de 900 millones de imágenes en la web y este número va en aumento así que un poco de ayuda no viene nada mal.

Capítulo 4 - News and groups

Aqui vemos un par de herramientas muy interesantes como son News (Noticias) y Groups (NewsGroups). Sin dudas una de las herramientas mas llamativas que agrego Google en los ultimos tiempos, al menos para mi, fue la de noticias; la misma muestra en su home una serie de notas tomadas de los distintos diarios del mundo, alrededor de 4500 al momento de escribirse este libro, que son las mas importantes del momento. Se dispone de un buscador con una sintaxis breve, no tan amplia como el buscador de Google, pero que es suficiente para realizar busquedas en las noticias mundiales. En cuanto a groups se refiere Google cuenta con un archivo que se remonta desde 1981 hasta la fecha con cerca de 850 millones de mensajes de los mas variados temas, aqui se nos explican algunos trucos para optimizar las busqeudas ademas de una explicacion de como organiza google directorio de mensajes de groups.

Capítulo 5 - Add Ons

Add Ons son las herramientas que Google ha desarrollado como un agregado al buscador pero que en este caso corren en el equipo del usuario, entre los mencionados en este capítulo se encuentran Google Alerts, Google Toolbar, Google Desktop,Google by Email,Google by Instant Messenger (AOL),Google on IRC, Google by PDA or SmartPhone y algunas otras. Hay varias aplicaciones interesantes aqui pero una de la que mas llamó mi atención fue Google desktop, que nos permite indexar todo el contenido de nuestro equipo y mediante un motor de busquedas local corriendo en nuestra maquina para poder realizar busquedas locales y, como si esto fuera poco, integrar este buscador a las busquedas que realicemos en internet. Es importante destacar que nada del contenido que se indexe en nuestra maquina sera enviado a internet. Se mencionan tambien varias aplicaciones al menos curiosas como por ejemplo Google by mail o Google on IRC, que nos permiten armar un criterio de búsqueda y recibir los resultados por email y consultar un sencillo bot IRC respectivamente.

Capítulo 6 - Gmail

Gmail es una poderosa herramienta de gestion de información, ya que no solamente permite la gestión de emails sino que por su capacidad de almacenamiento y ordenacion de su contenido nos ofrece mucho mas que un simple almacen de correo via web. Este capítulo centra su primera parte en una extensa explicación de las herramientas disponibles para exportar nuestro sistema de mails actual con sus direcciones de libreta de contáctos y correos almacenados hacia nuestra cuenta de Gmail. En una segunda etapa veremos herramientas que nos posibilitan darle otro uso a nuestro Gmail como por ejemplo implementar un disco rigido virtual para almacenar archivos en la web y la posibilidad de leer nuestro correo desde una PDA o telefono celular. Al momento de esta review Gmail se mantenía en estado de BETA por lo cual los servicios sufren pequeños cambios y mejoras dia a dia.

Capítulo 7 - ADS

Seguramente para aquellos que sean webmasters este capítulo les resultara interesante, Google Ads es el aparato de marketing que tenemos disponible para promocionar nuestro sitio web dentro de los resultados de busqueda de Google; en este capítulo aprendemos como funciona el sistema de publicidades y como aprovechar las ventajas de el mismo. Si bien no es un informe exhaustivo del mismo, nos sirve para poder preparar nuestra campaña publicitaria teniendo en cuenta varios aspectos importantes a la hora de armarla; el autor nos da consejos y nos provee de algunos hacks para elegir las palabras claves que identificaran nuestros banners, se explica como utilizar los archivos historicos de ranking de palabras buscadas para ver que es lo que mas se esta buscando en la red y varios consejos acerca de que criterio utilizar para la publicidad. Sin dudas es un material que servira de mucho a la hora de invertir unos dolares en publicidad y sacarle el máximo provecho a ese dinero invertido.

Capítulo 8 - Webmastering

El cáliz sagrado de los webmasters es el algoritmo de PageRank de Google, siendo usuario de internet se puede ver a Google desde dos puntos de vista distintos; uno como navegante a quien le interesan encontrar una información determinada en la red y, otro como wembaster a quien le interesa que los usuarios nos encuentren en los primeros puestos dentro de los primeros resultados de búsqueda de Google. Se explica como funciona el pagerank, aunque Google nunca hizo publica la formula para determinar los PR (Page Rank) de las páginas y periodicamente es modificada para evitar manipuleos de la misma. Se nos dan consejos sobre como organizar mejor nuestro website para que el bot de Google se sienta comodo navegandolo e indexandolo; y como hacer para que ciertas páginas de nuestro sitio no sean indexadas.

Capítulo 9 - Programming Google

Para los programadores este es el capítulo mas interesante de todo el libro, aunque también de los mas cortos, aqui vemos como programar utilizando la API de google para poder implementar nuestro propio frontend. La mayor parte del codigo fuente del libro esta realizado en PERL pero en este capítulo encontramos los mismos ejemplos para varios lenguajes, PHP, Java, VB.NET Python y C#. Se explica como instalar los modulos de PERL Soap::Lite y NET::Google para dialogar con el buscador y sus resultados, es algo similar a los scripts del primer capítulo pero mas avanzados. Es mas que nada un capítulo introductorio y una vez que lo hayamos leido estaremos en condiciones de empezar a aprender por nuestros propios medios a utilizar mas a fondo esta API de programación, una nota a tener en cuenta es que Google nos permite solamente 1000 consultas diarias mediante la API asi que no hay que desaprovecharlas.