Sec24 – Google Hacking

Av: Oscar Andersson, Sec24, 2013-05-09

OBS:  Följande guider är enbart för utbildningssyfte och får absolut inte användas för olagliga ändamål.

Google hacking eller sökmotorhacking går ut på att komma åt publikt material med hjälp av olika söktermer. Materialet som finns tillgängligt är sällan menat att vara publikt. För att förstå hur detta kan ske gäller det att förstå hur en sökmotor fungerar. En sökmotor skickar ut spindlar på nätet (Även känt som crawlers eller bots) som går igenom hemsidor och allt material som finns där. Finns det nytt material så uppdateras dessa, finns det länkar följs dessa länkar och så vidare. All denna data sparas till sökmotorns databas där det sedan sorteras och till sist blir åtkomligt för användare. Om dessa spindlar inte funnits hade Google inte existerat och det hade varit väldigt svårt att sortera allt som finns på nätet. Problemet är att spindlarna inte tar hänsyn till vad de hittar. Det finns egentligen bara två olika tillstånd en spindel tar hänsyn till (Om spindeln är programmerad enligt Robots Exclusion Protocol). Antingen tillåts spindeln att indexera filer eller inte. Antingen kan spärren sättas i en metatagg för enskilda HTML-sidor eller i filen robots.txt i rotkatalogen. Problemet är att webbmasters ofta glömmer att spärra vissa kataloger. Ett ytterligare problem är att robots.txt kan tas fram av vem som helst för en enskild hemsida. Det är bara att skriva hemsidans namn följt av /robots.txt. Detta gör att illasinnade hackare kan kontrollera robots.txt och se vilka kataloger/filer som webbmastern vill gömma.

De stora problemen med Google Hacking började dock inte för så länge sedan. För bara ett par år sedan så började Google att indexera nya typer av data. Detta inkluderar filer såsom Word, Excel, PowerPoint, Access databaser, PDF och PostScript. Dessa filer ansågs av många som immuna för sökmotorns spindlar och kunde därför ligga under “gömda” länkar på webbservrar. Över en natt började dessa filer indexeras av Google och många företag, även regeringar, fick sina dokument tillagda i Googles databas. Detta skedde för några år sedan men det finns fortfarande väldigt mycket känslig information kvar på nätet och ny läggs upp hela tiden.

NSA, National Security Agency, listar i kapitlet Google Hacking ur boken Untangling the Web: A Guide to Internet Research följande data som störst chans att få fram via Google Hacking:

  • Personlig och/eller finansiell information
  • Användar-ID, dator- eller kontoinloggningar, lösenord
  • Privat, sekretessbelagd eller patentskyddad företagsdata
  • Känslig regeringsinformation
  • Sårbarheter i hemsidor och servrar som kan underlätta för intrång i webbplatsen.

Ett exempel som nämns är att den som letar efter hemlig information från Sydafrika sparad i ett Exceldokument kan använda följande sökfras:

filetype:xls site:za confidential

För att hitta information om budgetar från Indien kan följande sökterm användas:

filetype:xls site:in budget

Vanliga ord att söka på är proprietary, confidential, not for distribution, do not distribute och liknande. Det är även vanligt med sökningar för login, userid och password. Dessa ord är på engelska men orden används över hela världen. Exemplet nedan är login-information från Ryssland.

filetype:xls site:ru login

Felkonfigurerade webbservrar är även det en vanligt förekommande sökfras. Exempel nedan är för Sydkorea.

intitle:”index of” site:kr password

Den sista typen är en så kallad talföljdssökning (numrange search). Numrange är numera begränsat men användes tidigare både för kortbedrägerier och för att få fram personnummer. Det används genom att du skriver ett tal följt av två punkter och sedan ett nytt tal. Exempel nedan:

site:www.jordanislamicbank.com 617..780

De numera begränsade sökningarna var bland annat, med punkter mellan siffrorna:

numrange:4567000000000000  4567999999999999 visa

numrange:222000000  250999999 ssn

För er som vill läsa mer finns det flera publikationer av Johnny Long (johnnyihackstuff) som handlar om Google Hacking. Besök hans hemsida på johnny.ihackstuff.com.

Exempel på en publikation är: The Google Hacker’s Guide

Slutligen: Det finns ett citat som säger “It’s Easier to Find Anything Than It Is to Find Something”. Citat syftar på att det finns så mycket information på nätet så det gäller att begränsa sin sökning så gått det går. Detta genom att använda nyckelord, begränsa sidorna som visas och vilken filtyp du vill hitta.

Fler exempel på sökningar:

site:fr

site:office.microsoft.com

filetype:pdf – Bra för stora dokument av alla typer. Används ofta inom den akademiska världen, regeringar och företag. Flera PowerPoint-presentationer finns även tillgängliga som PDF.

filteype:doc – Interna arbetsdokument, rapporter, etc.

filetype:xls – Anställningsdata, dataregister, finansiell information

filetype:ppt – Genomgångar som ofta innehåller planer för framtiden både hos företag och regeringar.

site:www.companyname.com inurl:database

site:www.companyname.com inurl:directory

site:www.companyname.com inurl:index

site:www.companyname.com inurl:companies