Realizar búsquedas especiales con Google

Google hacking es una técnica utilizada en la etapa de information gathering o recopilación de información en el proceso de una prueba de penetración o auditoria de seguridad informática.

Si hacemos un uso correcto de esta técnica podremos obtener mas que simple información.
Debemos comprender que en nuestro sitios web, nosotros somos quien le dice a los buscadores que indexar y que no. En otras palabras que es lo que deseamos que sea localizable por los buscadores.
La forma en que le decimos a un buscador que deseamos que no indexe es utilizando el archivo Robots.txt, el cual generalmente esta en texto plano y se encuentra alojado en los sitios web.
Ejemplo de un archivo Robots.txt:
User-agent:*
Disallow:/wp-admin(
Disallow:/wp-includes/
User-agent : Permite que este archivo sea visto por todos los buscadores
Disallow : Deniega la indexacion de lo que indiquemos, en este caso esta denegando que podamos acceder:
Este archivos nos brinda mucha información, por ejemplo podemos identificar que es un sitio basado en WordPress.
Como todos sabemos Google es el buscador mas utilizado a nivel mundial, podemos realizar busquedas utilizando texto simple, pero también nos da la opción de usar cierto tipo de caracteres especiales, operadores lógicos o booleano para afinar nuestras búsquedas.
Operadores Lógicos
NOT ( - )
Ejemplo: Buscaremos ingenierías pero evitando las ingenierias en sistemas e indrustrial
Ingenieria -sistema -industrial
OR ( | )
Ejemplo: Haremos una búsqueda pero queremos que cualquiera de 2 palabras.
futbol|brasileño
AND ( + )
Ejemplo: Buscar apartamento en una ciudad espeifica.
Apartamentos +Madrid
Operadores o Dorks
site
Ejemplo: Para buscar en un sitio especifico.
site:rootear.com Arduino
Tambien podemos usar este operador para buscar en sitios con un dominio especifico así:
site:es
filetype
Busca archivos de cierto tipo que nosotros definamos, ejemplo:
- txt (Archivos de Texto Plano)
- doc (Archivos Word)
- pdf (Documentos PDF)
- db (Base de datos)
- log (Archivo de logs)
- etc
Ejemplo:
site:gob.es filetype:xls
site:gob.es filetype:pdf Economía
En el primer ejemplo buscamos en los sitios con dominios gob.es archivos de Excel, en el segundo ejemplo buscamos en sitios con el mismo dominio, pero que tengan archivos PDF y que contengan la palabra Economía.
Otros operadores
Allintext: Este operador busca una cadena de texto dentro de una pagina web y no dentro de una URL. (No se puede utilizar junto a otros) Allintitle: Busca una cadena de texto solo dentro del titulo de una web. (No se puede utilizar junto a otros) Intitle: Busca una cadena de texto dentro del titulo de una web. (Se puede utilizar junto a otros) Allinurl: Busca una cadena de texto solo en la url. (No se puede utilizar junto a otros) Inurl: Busca una cadena de texto en la url. (Se puede utilizar junto a otros) Author: Busca artículos o noticias escritos por el nombre o la dirección de correoindicada. (Se puede utilizar junto a otros) Cache:dominio.com: Con este operador accedemos a la web que Google tiene en su cache. Útil para cuando borraron un tema y no ha pasado mucho tiempo (No se puede utilizar junto a otros)
Link:dominio.com
Este operador se utiliza para buscar enlaces que apunten a un determinado sitio web. (No se puede utilizar junto a otros)
Related:dominio.com
Busca paginas relacionadas. (No se puede utilizar junto a otros)
En este link podemos encontrar una lista mas completa de operadores que podemos utilizar.
Con todo lo que anteriormente aprendimos y nos ponemos creativos podríamos realizar una búsqueda de este tipo:
filetype:sql "# dumping data for table" "'PASSWORD' varchar"
Esta búsqueda nos podría arrojar resultados de archivos de extención sql, posibemente con volcado de bases de datos completas.
Encerramos entre comillas el texto cuando es una frase que queremos buscar específicamente.
Podríamos utilizar varios dorks en una sola consulta:
ext:sql intext:@gmail.com intext:password
Sí, los resultados de estas dos últimas búsquedas son realmente espeluznantes, ya que no hemos tenido necesidad de ingresar a un servidor o "hackearlo" para obtener datos relevantes.
La información esta ahí, solo hay que saber como y con que herramientas buscar.