Сайт isaran.ru и его аудитория: анализ и перспективы развития on-line активности Информационной системы Архива РАН

Сайт isaran.ru и его аудитория:
анализ и перспективы развития on-line активности Информационной системы Архива РАН

 

1.1. Системы оценки деятельности научных учреждений в интернете

Наполнение ресурсами веб-сайтов научных учреждений и создание системы доступа пользователей к этим ресурсам является одним из факторов, определяющих их имидж в восприятии пользователей, научных администраторов и представителей организационных структур, ответственных за государственную поддержку развития науки. В настоящее время повышение качества интернет-ресурсов является актуальным как для большинства российских научных учреждений, так и для отечественных архивов. Поэтому анализ привлекательности веб-сайтов, отраженный в специализированных рейтингах, в принципе может рассматриваться как инструмент, выявляющий слабые стороны и указывающий возможные пути совершенствования информационной политики учреждения. С другой стороны, оценке подлежат и сами разработки подобных рейтингов в отношении их применимости для развития научно-информационных ресурсов в конкретной предметной области, в том числе и в архивной.

Количественный анализ интернет-контента получил специальное название в рамках новой дисциплины вебометрики (или cybermetrics)[1]. Пионером в области сопоставительного измерения рейтингов научно-образовательных учреждений на основе количественного анализа интернет-контента веб-сайтов стала Лаборатория Киберметрики (Cybermetrics Lab), — исследовательская группа, входящая в Национальный исследовательский Совет (CSIC), крупнейшую организацию в сфере исследований в Испании. Cybermetrics Lab начала исследование вебометрического рейтинга научных учреждений и университетов по всему миру в 2004 г., обновляя информацию каждые 6 месяцев (данные собираются в январе и июле и публикуются через месяц). До настоящего времени этот проект остается единственной, насколько нам известно, исследовательской разработкой в области вебометрики, аккумулирующей сведения об интернет-активности исследовательских центров из разных стран. Рейтинг испанских исследователей получил определенное общественное признание.

Долгосрочное исследование Cybermetrics Lab под названием «Ranking Web of World Research Centers» (http://research.webometrics.info) включает межстрановое ранжирование научных и исследовательских учреждений по крупным регионам, причем интернет-деятельность российских учреждений отдельно не выделена и отражается в разделе «Центральная и Восточная Европа». Российские научные учреждения занимают достаточно низкие позиции в рейтинге Cybermetrics Lab. Их скромное положение объясняется такими причинами, как малое количество англоязычных веб-страниц, низкая активность ученых и преподавателей в формировании контента веб-ресурсов и недостаток внешних гиперссылок, отражающий невысокую коммуникабельность в веб-пространстве. Следует отметить, что Cybermetrics Lab анализирует сайты самих учреждений и те ресурсы[2], интернет-адресация которых определяется субдоменами этих сайтов, но анализ не включает веб-ресурсы и проекты, обладающие самостоятельными доменами (второго уровня). Поэтому, в частности, в рейтинг Cybermetrics Lab не входит сайт isaran.ru. Более того, среди научных учреждений соответствующего регионального раздела, сайт arran.ru также не нашел отражения в рейтинге. В этом отношении, ситуация с отражением в рейтинге Cybermetrics Lab деятельности Архива РАН и его Информационной системы в интернете, не уникальна. Из числа архивных учреждений мира в этом рейтинге присутствуют только три сайта, включение которых в рейтинг носит явно случайный характер (сайты Национального архива Норвегии, Норвежского архива профессиональных союзов и Бельгийского Архива и Музея литературы).

Наиболее представительные, с точки зрения аналитиков, научные веб-ресурсы Центральной и Восточной Европы для справки приведены в таблице 1.

Табл. 1: Топ-5 веб-активности исследовательских учреждений Центральной и Восточной Европы (по версии Cybermetrics Lab)

ranking World Ranksort ascending Institute Country Size Visibility Rich Files scholar
1 7488 Institute of Applied Mathematics and Automatization RAS bandera 7361 7361 7080 4903
2 7477 Institute of Space Research and Radio Wave Propagation RAS bandera 7276 7361 7080 4903
3 7474 Research Institute of Machine Building bandera 7268 7361 7080 4903
4 7463 Institutum Mauritanum bandera 7158 7361 7080 4903
5 7437 Institute Belniilit Belarus bandera 6576 7361 7080 4903

В таблице 1 отражены соответствующие индикаторы (параметры) ранжирования: Size (количество страниц сайта, покрываемых поисковыми системами), Visibility (количество уникальных внешних ссылок на страницы сайта), Rich Files (количество «ценных», или «богатых» файлов, размещенных на сайте – т.е. файлы в форматах pdf, doc и т.п.), Scholar (количество ссылок на сайт учреждения, обнаруживаемых поисковой машиной Google Scholar), — последний параметр отвечает за научный характер ссылок. Для получения интегрального (обобщающего) значения в рейтинге (World Rank) количественные данные по каждому из параметров суммируются с некоторыми весами (множителями), числовые значения которых для каждого из названных четырех индикаторов определяются эмпирически. Следует учитывать, что основные методологические принципы и параметры измерения, использованные испанскими аналитиками, были взяты за основу и другими исследователями в области вебометрики.

Очевидно, однако, что рейтинг Cybermetrics Lab в целом не учитывает специфику научно-информационной деятельности архивных учреждений и, в частности, их деятельности в интернете, и потому вряд ли может служить ориентиром для совершенствования сайтов isaran.ru и arran.ru.

Иной опыт вебометрического исследования принадлежит российским исследователям из Карельского научного центра (КНЦ) РАН, задавшихся целью создания информационной системы вебометрического ранжирования онлайн-ресурсов научных учреждений России. Соответствующий проект КНЦ РАН (http://webometrics-net.ru) использует другую, описанную на сайте проекта методологию, хотя и схожую по базовым принципам с методикой Cybermetrics Lab. Рейтинги учреждений РАН вычисляются по семи параметрам, на основании значений которых затем рассчитывается величина интегрального ранга, определяющего положение сайта в рейтинге.  Ниже приводится список 10 учреждений, имеющих наиболее высокие показатели веб-активности среди 394 учитываемых в рейтинге КНЦ РАН организаций.

Таблица 2. Топ-5 веб-активности учреждений РАН по версии КНЦ

ранг в группе общий ранг название учреждения РАН инфо место по вычисляемому индикатору
Par1 Par2 Par3 Par4 Par5 Par6 Par7
1 1 Институт вычислительных технологий СО РАН more 59 89 77 93 99 80 98
2 2 Физико-технический институт им. Иоффе РАН more 8 84 65 1 1 1 100
3 3 Музей антропологии и этнографии им. Петра Великого (Кунсткамера) РАН more 87 37 80 90 80 92 100
4 4 Институт математики им. С.Л. Соболева CО РАН more 87 88 79 89 77 91 100
5 5 Институт космических исследований РАН more 64 94 46 93 90 99 100

 

Сайт isaran.ru в вебометрической системе аналитиков КНЦ не представлен, а сайт Архива РАН arran.ru наделен общим рангом со значением 194, что делает его далеко отставшим от сайтов-лидеров. Сведения об информационном наполнении сайта arran.ru по данным различных поисковых систем представлены в «Вебометрическом рейтинге научных учреждений России» КНЦ РАН следующим образом:

Таблица 3. Значения исходных вебометрических индикаторов arran.ru:

Yandex Google BeeCrawler GoogleScholar
Число страниц Число "богатых" файлов Число страниц Число ссылок Число "богатых" файлов Число ссылок Число сайтов "Научные" ссылки
937 14 892 15 2 5 5 0

 

Показательно, что поисковые системы не учитывают сотни файлов, содержащие оцифрованные архивные описи дел (всего в ИС представлено 1079 фондов только из Архива РАН). Очевидно, этот пробел в учете вызван тем, что на сайте ИС АРАН описи представлены в форматах, не позволяющих пользователям осуществлять локальную загрузку. Соответственно, поэтому о масштабах веб-информатизации АРАН «не знает» крупнейшая поисковая система научных публикаций GoogleScholar (http://scholar.google.com). 

Таким образом, существующие в настоящее время системы вебометрического анализа не учитывают и, соответственно, не отражают сведений о научно-информационной деятельности Архива РАН, и потому не могут служить ориентиром в развитии ИС АРАН.

Однако такие ориентиры могут быть получены в результате анализа данных российской системы интернет-статистики HotLog (http://hotlog.ru). В HotLog также формируются рейтинги сайтов научных и образовательных учреждений, однако они имеют свои особенности. Во-первых, место в рейтинге определяется не путем расчета индикаторов, как в системах вебометрического анализа, а напрямую формируется на основании запросов пользователей. Во-вторых, к сайтам научных учреждений HotLog относит не только сайты организаций, входящих в систему РАН, но и сайты различных образовательных учреждений (в том числе средних школ), сайты тематических научно-образовательных и исследовательских проектов, коммерческих организаций, прямо или опосредованно связанных с наукой или позиционирующих себя как научные, и т.п. В-третьих, в рейтинг включены сайты соответствующих организаций и проектов не только из России, но и по всему СНГ, включая Украину. В результате рейтинг «научных» учреждений от HotLog за ноябрь текущего года (данные на более широком хронологическом интервале, чем 1 месяц, система не предоставляет) выглядит следующим образом:

Таблица 4. Топ-20 «научных» учреждений по данным HotLog (нояб. 2014 г.)

+/- Название сайта Посетители Хиты
1 +1 Cайт кафедри педагогіки і психології вищої школи НПУ ім.М.П.Драгоманов 34 859   73 872
2 +1 Палеонтологический институт РАН 27 003   118 512
3 -2 Филологический факультет МГУ им. М. В. Ломоносова 20 014   93 140
4 +1 Лаборатория электронных средств обучения 9 185   22 488
5 +1 Интернет-портал "ВСЁ О ГИПЕРБОРЕЕ" 8 953   40 262
6 +4 Филиал АО НЦПК Oрлеу Институт повышения квалификации педагогических ... 7 524   22 637
8 0 Институт Российской истории РАН 6 832   31 316
9 +22 Официальный сайт школы №99 г. Омск 6 181   9 519
10 -1 В Полный Рост, сайт эниологии - разум, осознание, сила мысли. 5 480   13 830
11 +3 Уральское отделение РАН 4 969   39 554
12 -1 Сайт Школы научной астрологии 4 637   17 575
13 +5 Информационная система Архивы Российской академии наук 4 265   11 692
14 -1 Бюро переводов Украина: перевод текста, апостиль и легализация, перевод с ... 4 258   6 677
15 0 ГНЦ РФ - ФЭИ >> Главная страница 3 958   19 331
16 +4 Кафедра педагогики РГПУ им. А. И. Герцена 3 890   9 245
17 -1 ОАО НИИ Гириконд 3 794   16 166
18 -14 Веб-сайт Николаевского Экономического лицея №2 3 694   6 853
19 +2 Институт Экономической Политики им. Е.Т. Гайдара 3 344   6 689
20 +6 Архивы Российской Академии Наук 3 315   12 024

Поскольку место в этом рейтинге определяется исключительно количеством посещений пользователей и данными о загрузке ими веб-страниц (хиты), то может вызвать удивление лидер рейтинга, которым оказалось подразделение одного из педагогических институтов Украины. Место этого учреждения в рейтинге объясняется наличием на его сайте коммерческой интернет-рекламы, привлечение которой используют и некоторые другие сайты-лидеры рейтинга, увеличивающие тем самым свою посещаемость. Вместе с тем, не содержащие такой рекламы сайты isaran.ru (13 место) и arran.ru (20 место) имеют в том же рейтинге вполне представительные позиции за счет собственного, оригинального контента. Таким образом, данные интернет-статистики HotLog, полученные с помощью непосредственной фиксации сведений о посещаемости пользователей, оказываются более содержательными и интерпретируемыми, чем оценки рейтингов сайтов научных учреждений, получаемые вследствие расчета вебометрических индикаторов. В связи с этим HotLog представляет собой полезный инструмент, позволяющий определить ориентиры развития ИС АРАН.

1.2. Посещаемость сайта isaran.ru по данным интернет-статистики и ее анализ

Для оценки динамики посещаемости сайта isaran.ru с помощью HotLog были получены и проанализированы данные о посещаемости сайта за год — с ноября 2013 по ноябрь 2014 г. Выбор хронологического интервала был продиктован, с одной стороны, необходимостью охвата достаточно представительного периода, а с другой — потребностью учета недавних показателей. Соответствующие данные статистики представлены на следующей диаграмме, сопровожденной таблицей с числовыми показателями.

Рис. 1. Посещаемость isaran.ru ( нояб. 2013 – нояб. 2014)

Как видно из диаграммы, среднемесячное число посетителей составляет около 3 тыс. (около 100 посетителей в день), при том, что в конце весны и летом происходит закономерный спад активности интернет-пользователей ИС АРАН, число которых падает до 2 тыс. Вместе с тем, количество посетителей ресурса, составлявшее в начале ноября прошлого года немногим более 3 тыс. человек, выросло за год почти на 700 (+21,6%). Для сравнения, в декабре 2012 г. isaran.ru посетили 2746 пользователей, — таким образом, налицо устойчивый рост аудитории ИС АРАН.

Как показывает статистика, пользователи из России составили за год (с 29.11.2013 по 29.11.2014 г.) более 80% всех посетителей isaran.ru:

Рис. 2. Пользователи isaran.ru: распределение по странам

При этом около половины внутрироссийских обращений к ИС АРАН происходит из Москвы, что отражено в следующей таблице:

Таблица 5. Распределение посетителей ИС АРАН по регионам

Регион Всего пользователей Доля
Москва 14174 46,3%
Санкт-Петербург 3575 11,7%
Московская область 1652 5,4%
Новосибирская область 962 3,1%
Свердловская область 794 2,6%
Челябинская область 558 1,8%
Нижегородская область 481 1,6%
Самарская область 467 1,5%
Республика Татарстан 450 1,5%
Краснодарский край 426 1,4%
Республика Башкортостан 325 1,1%
Приморский край 309 1,0%
Ростовская область 305 1,0%

Обращения к сайту из других регионов составляют менее процента от общего числа и потому в таблице 5 не отражены.

В значительной мере посетители обращаются к ИС АРАН вследствие запросов через поисковые системы. За год поисковые системы обеспечили свыше 23 тыс. переходов (около 100 в месяц) на материалы сайта isaran.ru. При этом лидером формирования запросов пользователей, привлеченных на isaran.ru, является поисковая система google, оставившая позади yandex и прочие поисковики. Результаты статистики с 29 ноября 2013 г. по 29 ноября 2014 г. представлены в нижеследующей таблице.

Таблица 6. Обращения пользователей к isaran.ru через поисковые системы

Поисковая система Переходов Доля Среднее за месяц
Всего 23364,0 100,0% 99,8
google.com 13308,0 57,0% 57,5
yandex.ru 7341,0 31,4% 33,4
mail.ru 1261,0 5,4% 4,5
images.google.com 1210,0 5,2% 3,3
rambler.ru 172,0 0,7% 0,9
images.yandex.ru 31,0 0,1% 0,0
bing.com 20,0 0,1% 0,1
nigma.ru 20,0 0,1% 0,1

Вместе с тем, посещаемость isaran.ru пользователями социальных сетей можно охарактеризовать как весьма низкую: почти за два года (с 1 января 2013 г. по 29 ноября текущего) в HotLog зарегистрированы всего 197 переходов на сайт из социальных сетей. Из них большинство приходятся на сети Vkontakte (102 перехода), Facebook (60) и Livejournal (15). В процентном отношении распределение переходов иллюстрирует прилагаемая ниже диаграмма.

Рис. 3. Посещаемость isaran.ru пользователями социальных сетей (1.01.2013-29.11.2014)

Эти данные позволяют полагать, что спрос на содержательную научную информацию у пользователей социальных сетей в значительной мере недонасыщен, и привлечение этих пользователей может способствовать повышению интереса широкой аудитории к ресурсам ИС АРАН.

1.3. ИС АРАН в социальной сети

Для возможного продвижения ИС АРАН в соцсетях следует прежде изучить опыт деятельности других архивных учреждений на соответствующих интернет-площадках. Как выясняется, ряд архивов США и Западной Европы активно используют для привлечения пользователей к своим ресурсам социальную сеть Facebook — такой выбор, очевидно, объясняется тем, что эта соцсеть относится к крупнейшим в мире, — она насчитывает 1,32 млрд зарегистрированных пользователей, а ее мировая суточная аудитория составила в марте текущего года 720 млн человек. Архивные учреждения используют Facebook для информирования пользователей о новостях и памятных датах фондообразователей, сведениях о раскрытии фондов, публикаций оцифрованных документов и целых коллекций, материалов выставок и т.п. Одновременно площадка Facebook используется как интерактивная контактная среда, в которой пользователи сети выражают свои впечатления о прочитанном, или увиденном в представленных архивом документах. В следующей таблице отражены сведения о деятельности и популярности некоторых архивов в Facebook по состоянию на 31 октября 2014 г.:

Таблица 7.

Архивный ресурс на Facebook Дата создания Подписчики / Участники обсуждений обновлений Регулярность обновлений
Archives nationales (France) Декабрь 2011 7853 / 359 ~1-2 раза в день
Archives départementales de la Manche Декабрь 2010 6760 / 518 ~1-2 раза в день
The National Archives (UK) Июнь 2008 г. 12,7 тыс. / 211 С осени 2009 г. – раз в неск. дней
US National Archives 2009 г. 94126 / 9 тыс. ~1 раз в день

 

Из приведенных данных следует, что по интенсивности вовлечения пользователей страница учреждения на Facebook может быть вполне сопоставима с деятельностью профильного сайта и привлекать тысячи подписчиков, получающих в регулярном режиме информацию об архивных новостях. Так, Национальный архив США по масштабам активности в Facebook может быть сравним с крупными СМИ.

Следует отметить, что деятельность российских архивных учреждений в Facebook отражена значительно скромнее. Так, страница РГАЛИ, обновляющаяся в среднем один-два раза в неделю, привлекла 1849 подписчиков (данные на конец ноября 2014 г.). РГИА представлен сразу в двух ипостасях: в качестве страницы, которую ведет от имени архива частное лицо, регулярно обеспечивая обновления страницы, и собрав благодаря этому 201 подписчика; и группы по интересам в количестве 303 человек, которую поддерживает официальный представитель архива. Таким образом, регулярная совокупная аудитория РГИА в Facebook пока насчитывает немногим более 500 человек.

Заключение

Ключевой вывод анализа оn-line активности ИС АРАН состоит в том, что социальный трафик, в отличие от прямого и поискового трафика, фактически является единственной разновидностью объема передаваемой информации, который в существующих условиях состояния и развития системы может быть повышен, а в перспективе обеспечить и рост референциального трафика. Наблюдения над деятельностью различных архивных организаций в социальной сети Facebook позволяют полагать, что использование этого ресурса для продвижения ИС АРАН может в течение 2015 г. сформировать собственную заинтересованную аудиторию не менее чем в несколько сотен человек. Для этого необходима информационная поддержка ресурса в режиме регулярных (не реже, чем еженедельных) обновлений с обязательным воспроизведением публикуемого на Facebook контента на основном сайте isaran.ru.

 

[1] Обзор методологических принципов вебометрики применительно к веб-ресурсам учреждений науки содержится в работе: Антопольский А.Б., Поляк Ю.Е., Усанов В.Е. О российском индексе вебсайтов научно-образовательных учреждений // Информационные ресурсы России. 2012. № 4. С. 2-7.

[2] Принципы составления рейтинга описаны на сайте проекта : http://research.webometrics.info/en/Methodology