Content Discovery
Robots.txt
Ce type de fichier permet d'autoriser ou non que certaines partie d'un site soit afficher dans les recherches à travers les moteurs de recherches. On peut dans ce cas trouver des informations intéressantes.
Le chemin d'accès est le suivant :
Favicon
Le favicon est une petite image représentant la plupart du temps le site dans l'onglet. La plupart des framework implémente des favicon par défaut. En partant de cette information nous pouvons récupérer le nom du framework utilisé grâce au favicon, d'autant plus que l'OWASP met à disposition un tableau de correspondance : md5 hash | framework.
https://wiki.owasp.org/index.php/OWASP_favicon_database
Exemple en bash:
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 1406 100 1406 0 0 7780 0 --:--:-- --:--:-- --:--:-- 7811
f276b19aabcb4ae8cda4d22625c6735f -
Ou en powersehll :
curl https://static-labs.tryhackme.cloud/sites/favicon/images/favicon.ico -UseBasicParsing -o favicon.ico
Si on cherche ce md5 : f276b19aabcb4ae8cda4d22625c6735f
sur le site de l'OWASP nous trouvons le framework suivant : cgiirc (0.5.9)
.
Sitemap.xml
A l'inverse du robots.txt, le sitemap déclare tous les fichiers qui doit être connu des moteurs de recherches. On peut y retrouver des accès compliqué à trouvé ou non accessible depuis le site.
Le chemin d'accès est le suivant :
Manual Discovery - HTTP Headers
Lorsque l'on réalise une requête HTTP vers un serveur web, des headers HTTP contenant uncertains nombre d'inforamtions nous sont renvoyés. Nous pouvons par exemple obtenir le type et la version du serveur web -nginx, paache, etc...).
Exemple de commande :
Manual Discovery - Framework Stack
Les framework utilisé peuvent être source d'infromartions importantes, notament les pages de login par défaut ainsi que les login par défaut.
OSINT - Google Hacking / Dorking
https://en.wikipedia.org/wiki/Google_hacking
OSINT - Wappalyzer
Wappalyzer (https://www.wappalyzer.com/) est un outil en ligne et une extension de navigateur qui aide à identifier les technologies utilisées par un site Web, telles que les frameworks, les systèmes de gestion de contenu (CMS), les processeurs de paiement et bien plus encore, et il peut même trouver également les numéros de version.