Как определить, на какой CMS работает сайт

Если нужно посмотреть на какой CMS работает тот или иной сайт можно воспользоватьмся одним из известных способов, указанных ниже

Если нужно посмотреть на какой CMS работает тот или иной сайт можно воспользоватьмся одним из известных способов, указанных ниже. В скобках указана степень приблизительная вероятности того, что после применения данного способа CMS определится.

  1. Просмотр html кода страницы (70%)
  2. Анализ файла robots.txt (30%)
  3. Внешний вид ссылок сайта (5%)
  4. Поиск файлов по заранее известному пути (5%)
  5. Поиск входа в админку (20%)
  6. Снифаем http трафик (5%)
  7. Смотрим на Cookie которые ставит сайт (90%)
  8. Используем on-line сервисы определения на какой CMS работает сайт (80%)

При вычислении CMS, нужно обладать знаниями об устройстве директорий движков, некоторые особенности известных вам CMS. Без опыта будет проблематично делать какие-либо выводы. Это касается почти всех перечисленных пунктов.

1. Просмотр html кода страницы

Это самый верный способ вычислить «клиента». Если повезет, CMS будет озвучена в мета теге generator. К примеру в блогах на WordPress пишется:

<meta name=»generator» content=»WordPress 2.7″ />

Если не повезет, нужно присмотреться к путям вложенных сss, javascript, графических файлов. Для того же wordpress характерны в путях папка wp-content.

<script type=»text/javascript» src=»http://dimox.name/wp-content/themes/dimox.name/scripts.js?1235565796″></script>

Стоит так же посмотреть закомментированный код. В случае с Invision Power Board он определяется кодом:

<!–ipb.javascript.start–>

2. Анализ файла robots.txt

Многие движки автоматически генерируют файл robots.txt в корне сайта, где запрещают к индексации определенные директории (системные, вход в админку и т.д.). Этим можно воспользоваться, и поискать в списке запрещенных знакомые папки или файлы.

В качестве примера файл robots.txt для Joomla выглядит следующим образом:

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /help/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /mambots/
Disallow: /media/
Disallow: /modules/
Disallow: /templates/
Disallow: /installation/

Возможны конечно отклонения, но директории в основном будут типичные.

3. Внешний вид ссылок сайта

Смотрите на внешний вид внутренних ссылок проверяемого сайта. Твердо сказать по ссылке что за CMS, возможно и не получится, учитывая что многие вебмастера настраивают ЧПУ под свои любимые схемы. Но в качестве дополнительного аргумента может помочь. Вот известные примеры, характерные для некоторых CMS:

WordPress
/p=501 (в виде ссылок по умолчанию)
Joomla
/index.php?option=com_content&task=view&id=80&Itemid=202
/content/view/69/109/
MaxSite CMS
/page/ispolzuem-avatarki
vBulletin
/showthread.php?t=300606
IPB
/index.php?showtopic=36

Еще можно посмотреть на параметры сайта. Говорят, что для osCommerce характерны параметры cPath и cSid.

4. Поиск файлов по заранее известному пути

Способ в общем-то авантюрный, и использовать его есть смысл если есть подозрения на ту или иную CMS.

Очень красивый пример привел на SearchEngines Dangel в топике, где просили определить CMS сайта karpiy.com.ua. Очевидно у него возникли подозрения, что на сайте нет CMS, а в качестве движка используется фреймворк Codeigniter. Он подставил к адресу сайта путь к логотипу CI – /system/scaffolding/images/logo.jpg, и оказался прав: там действительно был CodeIgniter.

Так же можно запросить какой-нибудь стандартный файл движка на который упало подозрение. Это может быть css файл шаблона по умолчанию, корый неизменно копируется при заливке движка, файл readme.txt в корне  и т.д.

5. Поиск входа в админку

Добавьте к корню сайта вероятные адреса админок для популярных сайтов, возможно они засветят вход в админку.

WordPress
/wp-admin/
Joomla
/administrator/
Danneo
/apanel/
MaxSite CMS
/admin/

6. Снифаем http трафик

Открываем любой сниффер http пакетов, к примеру CommView или плагин для Firefox (HttpFox), и просматриваем ответ сервера, а именно нас интересует http хеадер.

Битрикс ставит дополнительное поле, таким образом наверное дополнительно пиаря себя узкому кругу любителей снифать трафик

X-Powered-CMS: Bitrix Site Manager (582fd04dac6869e159ea80524ec43d0d)

7. Смотрим на Cookie которые ставит сайт

С помощью того же сниффера смотрим название кукисов, которые ставит движок. Этим способом легко вычисляются:

UMI CMS
umicms_session

MaxSite CMS
maxsite_comuser

WordPress
wp-settings

«Спрятать» CMS можно, но это достаточно сложно. В большинстве случаев название движка определяется по перечисленным способам.

 

Перед вами таблица, которая поможет определить, какую CMS использует сайт, подтвердить или опровергнуть ваши догадки.

CMS Страницы авторизации Видимость в HTML-коде страницы
Drupal /user в теге generator не видна. иногда можно узнать по дефолтному фавикону - синей капле с глазами
/?q=user обычно в коде есть перечень модулей, путь к ним начинается с /sites/all/modules/
/login адреса внутренних страниц сайта по умолчанию имеют вид /node/1 (2, 3, другое примитивное число)
WordPress /wp-login.php в коде ищите сочетание "wp": например, wp-content

/wp-admin/
TYPO3 /typo3/index.php в коде почти всегда есть примечание на целый абзац: "This website is powered by TYPO3" и так далее
Joomla! /administrator/index.php в коде часто есть указание в теге generator. если его нет, ищите сочетания "joomla" или просто "joo" в названиях модулей. можно еще узнать по дефолтному фавикону - сине-зелено-оранжево-красная четырехугольная звездочка


картинки часто хранятся в /images/stories
Plone /login_form ищите слово "plone" либо в теге generator, либо в других элементах кода


путь к Zope: /manage/
Django /admin/
CMS Made Simple /admin/login.php
DataLife Engine (DLE) /index.php?do=login обычно указано в теге generator. если нет, ищите сочетания "dle" и "engine" в коде страницы


при запросе /engine/print.php?newsid=0 выдаст текст "Невозможно загрузить шаблон: shortstory.tpl"


страница статистики - /statistics.html
MODx /manager ищите "modx" в коде страницы

/modx/manager
Movable Type /cgi-bin/mt/mt.cgi страница конфигурации: /cgi-bin/mt/mt-check.cgi
InstantCMS /admin

/admin/login.php
MaxSite CMS /admin

/auth/?act=login
1C:Битрикс /auth в коде можно найти сочетание "bitrix", например, в JavaScript: 'cookiePrefix': 'BITRIX_SM'

/bitrix/admin CSS и картинки подключаются из папки /bitrix

<link href="/bitrix/templates/securitylab/components/securitylab/news.list/index/
style.css" type="text/css" rel="stylesheet" />
<link href="/bitrix/templates/securitylab/styles.css" type="text/css" rel="stylesheet" />

<img src="/bitrix/templates/securitylab/img/icn/home.gif" width="13" height="12"
alt="на главную" title="на главную" />


/cp

/auth.php?forgot_password=yes - восстановление пароля

/auth.php?register=yes - регистрация
NetCat /netcat/ дефолтный фавикон - силуэт кошачьей головы. в коде можно найти сочетание "netcat"


файлы хранятся по адресу /netcat_files
UMI.CMS /admin/ ищите в коде "umi" либо строку <!-- This page generated in * secs --> в самом низу страницы

/admin/content/sitetree/ файл /js/easy.php будет содержать "umi"
HostCMS /users

/admin
Amiro CMS /members часто есть сноска внизу страницы - "работает на Amiro.CMS"
Magento /downloader/ При переключении с языка на язык к URL добавляется ?___store=eng&___from_store=rus

/admin/
Danneo /admin/

/apanel/login.php
S.Builder /cms/kernel/admin.php
ABO.CMS /login.php
e107 /e107_admin/admin.php в футере «This site is powered by e107», картинки, ява-скрипты, плагины и т.п. подгружаются из директорий e107_* (e107_plugins, e107_files ...)
LiveStreet /registration - регистрация <script language="Javascript" type="text/javascript">
var DIR_WEB_ROOT='http://.......';
var DIR_STATIC_SKIN='http://......../templates/skin/....';
var BLOG_USE_TINYMCE='';
</script>

/login/reminder - восстановление пароля <body onload="prettyPrint()">
<link rel="search" type="application/opensearchdescription+xml" href="http://....../search/opensearch/"


Копирайт:
воспользовался <a href="http://livestreet.ru" title="Free social engine">LiveStreet</a>
Twilight CMS /admin/
Textpattern /textpattern/
OSCommerce /admin
PHP-Fusion /administration
Melbis /admin/ По лицензии внизу страницы обычно стоит ссылка. URL страниц обычно начинаются с /dir: /dir_televideo.htm, например.
Miva Merchant /mm5 скрипты с расширением mvc, например merchant.mvc, admin.mvc. Часто эту CMS ставят в директорию mm5 (актуально для пятой версии).
phpwcms /login.php
N2 CMS /edit/
Explay CMS /system/cms
ExpressionEngine /member/login/
Klarnet CMS /klarnetCMS/
СЕКУНДА /admin/
SiteDNK /admin
CM5 /cpanel
Aquarius /admin/
Site Sapiens /admin/
Cetera CMS /admin/index.php
Hitmaster /admin/
DSite /admin/
SiteEdit /admin/
Optimizer.NET /admin/
Trinet CMS /admin/
Adlabs.CMS /admin/
Proxima CMS /admin/
WEBO CMS /admin/login/
Hi-Tech Content Manager /admin/
Introweb-CMS /admin/
iNTERNET.cms /admin/
Kentico CMS /cmsdesk
Trickster CMS /admin



DB.DRIVE /forum/login.php
CMS Invictum v2 /root/
SMF
в коде обычно есть JS-вставки: var smf_theme_url = "http://Forum_URL/Themes/default";
var smf_images_url = "http://Forum_URL/Themes/default/images"; и так далее


один из мета-тегов: <meta name="keywords" content="PHP, MySQL, bulletin, board, free, open,
source, smf, simple, machines, forum" />


копирайты: <a href="http://www.simplemachines.org/" title="Simple Machines Forum" target="_blank">
Powered by SMF 1.1.4</a>
IP.Board
комментарии в html: <!--ipb.javascript.start-->


var ipb_var_st            = "0";
var ipb_lang_tpl_q1       = "Введите номер страницы, на которую хотите перейти.";
var ipb_var_s             = "*какой-то хэш*";
var ipb_var_phpext        = "php"; и так далее...


копирайты — содержат слово IP.Board и ссылки на IBResouce\invisionboard.com
vBulletin /usercp.php - личный раздел <meta name="generator" content="vBulletin 3.8.2" />

/faq.php - справка CSS:

/**
* vBulletin 3.8.2 CSS
* Style: 'Default Style'; Style ID: 1
*/


login.php - вход JS

var vb_disable_ajax = parseInt("0", 10);


calendar.php - календарь названия классов: <td class="vbmenu_control">

search.php - поиск копирайты: Powered by vBulletin® Version 3.8.2<br />Copyright ©2000 - 2009, Jelsoft Enterprises Ltd.
phpBB /ucp.php - личный раздел <meta name="copyright" content="2000, 2002, 2005, 2007 phpBB Group" />


JS:

if (0)
{
popup('./ucp.php?i=pm&mode=popup', 400, 225, '_phpbbprivmsg');
}



копирайт:

<div id="wrapfooter">
<span class="copyright">Powered by <a href="http://www.phpbb.com/">phpBB</a> © 2000, 2002, 2005, 2007 phpBB Group
<br /><a href='http://www.phpbbguru.net/'>Русская поддержка phpBB</a></span>
</div>



Комментарий в HTML:

<!--
We request you retain the full copyright notice below including the link to www.phpbb.com.
...
The phpBB Group : 2007
//-->

И в заключение список сервисов определения на какой CMS работает сайт:

On-line сервисы определения на какой CMS работает сайт

1. Builtwith _builtwith.com
Данный сервис позволяет не только определить движок сайта, но и дать развернутую информацию о таких характеристиках сайта как:
CMS сайта
Сервер (например Apache)
Язык программирования, фреймворк
Какие системы аналитики используются (Google, Liveinternet и т.п. )
Какие библиотеки JavaScript (Jquery, Prototype и т.п. )
Какие плагины установлены (опознает не все, но наиболее популярные точно)
Кодировка
Технологии RSS
Индекс оптимизации сайта

2. _http://www.itrack.ru/whatcms/ сервис определения CMS
Сервис работает в тестовом режиме.
В базе более 50 систем управления.

_http://webmastercoffee.com/ англоязычный сервис

3. _http://2ip.ru/cms/ - лучший IMXO

4. Ссылка на плагин Firefox: определение CMS сайта _https://addons.mozilla.org/en-US/firefox/addon/10229