анализ и перспективы развития on-line активности Информационной системы Архива РАН
1.1. Системы оценки деятельности научных учреждений в интернете
Наполнение ресурсами веб-сайтов научных учреждений и создание системы доступа пользователей к этим ресурсам является одним из факторов, определяющих их имидж в восприятии пользователей, научных администраторов и представителей организационных структур, ответственных за государственную поддержку развития науки. В настоящее время повышение качества интернет-ресурсов является актуальным как для большинства российских научных учреждений, так и для отечественных архивов. Поэтому анализ привлекательности веб-сайтов, отраженный в специализированных рейтингах, в принципе может рассматриваться как инструмент, выявляющий слабые стороны и указывающий возможные пути совершенствования информационной политики учреждения. С другой стороны, оценке подлежат и сами разработки подобных рейтингов в отношении их применимости для развития научно-информационных ресурсов в конкретной предметной области, в том числе и в архивной.
Количественный анализ интернет-контента получил специальное название в рамках новой дисциплины вебометрики (или cybermetrics)[1]. Пионером в области сопоставительного измерения рейтингов научно-образовательных учреждений на основе количественного анализа интернет-контента веб-сайтов стала Лаборатория Киберметрики (Cybermetrics Lab), — исследовательская группа, входящая в Национальный исследовательский Совет (CSIC), крупнейшую организацию в сфере исследований в Испании. Cybermetrics Lab начала исследование вебометрического рейтинга научных учреждений и университетов по всему миру в 2004 г., обновляя информацию каждые 6 месяцев (данные собираются в январе и июле и публикуются через месяц). До настоящего времени этот проект остается единственной, насколько нам известно, исследовательской разработкой в области вебометрики, аккумулирующей сведения об интернет-активности исследовательских центров из разных стран. Рейтинг испанских исследователей получил определенное общественное признание.
Долгосрочное исследование Cybermetrics Lab под названием «Ranking Web of World Research Centers» (http://research.webometrics.info) включает межстрановое ранжирование научных и исследовательских учреждений по крупным регионам, причем интернет-деятельность российских учреждений отдельно не выделена и отражается в разделе «Центральная и Восточная Европа». Российские научные учреждения занимают достаточно низкие позиции в рейтинге Cybermetrics Lab. Их скромное положение объясняется такими причинами, как малое количество англоязычных веб-страниц, низкая активность ученых и преподавателей в формировании контента веб-ресурсов и недостаток внешних гиперссылок, отражающий невысокую коммуникабельность в веб-пространстве. Следует отметить, что Cybermetrics Lab анализирует сайты самих учреждений и те ресурсы[2], интернет-адресация которых определяется субдоменами этих сайтов, но анализ не включает веб-ресурсы и проекты, обладающие самостоятельными доменами (второго уровня). Поэтому, в частности, в рейтинг Cybermetrics Lab не входит сайт isaran.ru. Более того, среди научных учреждений соответствующего регионального раздела, сайт arran.ru также не нашел отражения в рейтинге. В этом отношении, ситуация с отражением в рейтинге Cybermetrics Lab деятельности Архива РАН и его Информационной системы в интернете, не уникальна. Из числа архивных учреждений мира в этом рейтинге присутствуют только три сайта, включение которых в рейтинг носит явно случайный характер (сайты Национального архива Норвегии, Норвежского архива профессиональных союзов и Бельгийского Архива и Музея литературы).
Наиболее представительные, с точки зрения аналитиков, научные веб-ресурсы Центральной и Восточной Европы для справки приведены в таблице 1.
Табл. 1: Топ-5 веб-активности исследовательских учреждений Центральной и Восточной Европы (по версии Cybermetrics Lab)
ranking | World Rank | Institute | Country | Size | Visibility | Rich Files | scholar |
---|---|---|---|---|---|---|---|
1 | 7488 | Institute of Applied Mathematics and Automatization RAS | 7361 | 7361 | 7080 | 4903 | |
2 | 7477 | Institute of Space Research and Radio Wave Propagation RAS | 7276 | 7361 | 7080 | 4903 | |
3 | 7474 | Research Institute of Machine Building | 7268 | 7361 | 7080 | 4903 | |
4 | 7463 | Institutum Mauritanum | 7158 | 7361 | 7080 | 4903 | |
5 | 7437 | Institute Belniilit Belarus | 6576 | 7361 | 7080 | 4903 |
В таблице 1 отражены соответствующие индикаторы (параметры) ранжирования: Size (количество страниц сайта, покрываемых поисковыми системами), Visibility (количество уникальных внешних ссылок на страницы сайта), Rich Files (количество «ценных», или «богатых» файлов, размещенных на сайте – т.е. файлы в форматах pdf, doc и т.п.), Scholar (количество ссылок на сайт учреждения, обнаруживаемых поисковой машиной Google Scholar), — последний параметр отвечает за научный характер ссылок. Для получения интегрального (обобщающего) значения в рейтинге (World Rank) количественные данные по каждому из параметров суммируются с некоторыми весами (множителями), числовые значения которых для каждого из названных четырех индикаторов определяются эмпирически. Следует учитывать, что основные методологические принципы и параметры измерения, использованные испанскими аналитиками, были взяты за основу и другими исследователями в области вебометрики.
Очевидно, однако, что рейтинг Cybermetrics Lab в целом не учитывает специфику научно-информационной деятельности архивных учреждений и, в частности, их деятельности в интернете, и потому вряд ли может служить ориентиром для совершенствования сайтов isaran.ru и arran.ru.
Иной опыт вебометрического исследования принадлежит российским исследователям из Карельского научного центра (КНЦ) РАН, задавшихся целью создания информационной системы вебометрического ранжирования онлайн-ресурсов научных учреждений России. Соответствующий проект КНЦ РАН (http://webometrics-net.ru) использует другую, описанную на сайте проекта методологию, хотя и схожую по базовым принципам с методикой Cybermetrics Lab. Рейтинги учреждений РАН вычисляются по семи параметрам, на основании значений которых затем рассчитывается величина интегрального ранга, определяющего положение сайта в рейтинге. Ниже приводится список 10 учреждений, имеющих наиболее высокие показатели веб-активности среди 394 учитываемых в рейтинге КНЦ РАН организаций.
Таблица 2. Топ-5 веб-активности учреждений РАН по версии КНЦ
ранг в группе | общий ранг | название учреждения РАН | инфо | место по вычисляемому индикатору | ||||||
---|---|---|---|---|---|---|---|---|---|---|
Par1 | Par2 | Par3 | Par4 | Par5 | Par6 | Par7 | ||||
1 | 1 | Институт вычислительных технологий СО РАН | 59 | 89 | 77 | 93 | 99 | 80 | 98 | |
2 | 2 | Физико-технический институт им. Иоффе РАН | 8 | 84 | 65 | 1 | 1 | 1 | 100 | |
3 | 3 | Музей антропологии и этнографии им. Петра Великого (Кунсткамера) РАН | 87 | 37 | 80 | 90 | 80 | 92 | 100 | |
4 | 4 | Институт математики им. С.Л. Соболева CО РАН | 87 | 88 | 79 | 89 | 77 | 91 | 100 | |
5 | 5 | Институт космических исследований РАН | 64 | 94 | 46 | 93 | 90 | 99 | 100 |
Сайт isaran.ru в вебометрической системе аналитиков КНЦ не представлен, а сайт Архива РАН arran.ru наделен общим рангом со значением 194, что делает его далеко отставшим от сайтов-лидеров. Сведения об информационном наполнении сайта arran.ru по данным различных поисковых систем представлены в «Вебометрическом рейтинге научных учреждений России» КНЦ РАН следующим образом:
Таблица 3. Значения исходных вебометрических индикаторов arran.ru:
Yandex | BeeCrawler | GoogleScholar | |||||
---|---|---|---|---|---|---|---|
Число страниц | Число "богатых" файлов | Число страниц | Число ссылок | Число "богатых" файлов | Число ссылок | Число сайтов | "Научные" ссылки |
937 | 14 | 892 | 15 | 2 | 5 | 5 | 0 |
Показательно, что поисковые системы не учитывают сотни файлов, содержащие оцифрованные архивные описи дел (всего в ИС представлено 1079 фондов только из Архива РАН). Очевидно, этот пробел в учете вызван тем, что на сайте ИС АРАН описи представлены в форматах, не позволяющих пользователям осуществлять локальную загрузку. Соответственно, поэтому о масштабах веб-информатизации АРАН «не знает» крупнейшая поисковая система научных публикаций GoogleScholar (http://scholar.google.com).
Таким образом, существующие в настоящее время системы вебометрического анализа не учитывают и, соответственно, не отражают сведений о научно-информационной деятельности Архива РАН, и потому не могут служить ориентиром в развитии ИС АРАН.
Однако такие ориентиры могут быть получены в результате анализа данных российской системы интернет-статистики HotLog (http://hotlog.ru). В HotLog также формируются рейтинги сайтов научных и образовательных учреждений, однако они имеют свои особенности. Во-первых, место в рейтинге определяется не путем расчета индикаторов, как в системах вебометрического анализа, а напрямую формируется на основании запросов пользователей. Во-вторых, к сайтам научных учреждений HotLog относит не только сайты организаций, входящих в систему РАН, но и сайты различных образовательных учреждений (в том числе средних школ), сайты тематических научно-образовательных и исследовательских проектов, коммерческих организаций, прямо или опосредованно связанных с наукой или позиционирующих себя как научные, и т.п. В-третьих, в рейтинг включены сайты соответствующих организаций и проектов не только из России, но и по всему СНГ, включая Украину. В результате рейтинг «научных» учреждений от HotLog за ноябрь текущего года (данные на более широком хронологическом интервале, чем 1 месяц, система не предоставляет) выглядит следующим образом:
Таблица 4. Топ-20 «научных» учреждений по данным HotLog (нояб. 2014 г.)
Поскольку место в этом рейтинге определяется исключительно количеством посещений пользователей и данными о загрузке ими веб-страниц (хиты), то может вызвать удивление лидер рейтинга, которым оказалось подразделение одного из педагогических институтов Украины. Место этого учреждения в рейтинге объясняется наличием на его сайте коммерческой интернет-рекламы, привлечение которой используют и некоторые другие сайты-лидеры рейтинга, увеличивающие тем самым свою посещаемость. Вместе с тем, не содержащие такой рекламы сайты isaran.ru (13 место) и arran.ru (20 место) имеют в том же рейтинге вполне представительные позиции за счет собственного, оригинального контента. Таким образом, данные интернет-статистики HotLog, полученные с помощью непосредственной фиксации сведений о посещаемости пользователей, оказываются более содержательными и интерпретируемыми, чем оценки рейтингов сайтов научных учреждений, получаемые вследствие расчета вебометрических индикаторов. В связи с этим HotLog представляет собой полезный инструмент, позволяющий определить ориентиры развития ИС АРАН.
1.2. Посещаемость сайта isaran.ru по данным интернет-статистики и ее анализ
Для оценки динамики посещаемости сайта isaran.ru с помощью HotLog были получены и проанализированы данные о посещаемости сайта за год — с ноября 2013 по ноябрь 2014 г. Выбор хронологического интервала был продиктован, с одной стороны, необходимостью охвата достаточно представительного периода, а с другой — потребностью учета недавних показателей. Соответствующие данные статистики представлены на следующей диаграмме, сопровожденной таблицей с числовыми показателями.
Рис. 1. Посещаемость isaran.ru ( нояб. 2013 – нояб. 2014)
Как видно из диаграммы, среднемесячное число посетителей составляет около 3 тыс. (около 100 посетителей в день), при том, что в конце весны и летом происходит закономерный спад активности интернет-пользователей ИС АРАН, число которых падает до 2 тыс. Вместе с тем, количество посетителей ресурса, составлявшее в начале ноября прошлого года немногим более 3 тыс. человек, выросло за год почти на 700 (+21,6%). Для сравнения, в декабре 2012 г. isaran.ru посетили 2746 пользователей, — таким образом, налицо устойчивый рост аудитории ИС АРАН.
Как показывает статистика, пользователи из России составили за год (с 29.11.2013 по 29.11.2014 г.) более 80% всех посетителей isaran.ru:
Рис. 2. Пользователи isaran.ru: распределение по странам
При этом около половины внутрироссийских обращений к ИС АРАН происходит из Москвы, что отражено в следующей таблице:
Таблица 5. Распределение посетителей ИС АРАН по регионам
Регион | Всего пользователей | Доля |
---|---|---|
Москва | 14174 | 46,3% |
Санкт-Петербург | 3575 | 11,7% |
Московская область | 1652 | 5,4% |
Новосибирская область | 962 | 3,1% |
Свердловская область | 794 | 2,6% |
Челябинская область | 558 | 1,8% |
Нижегородская область | 481 | 1,6% |
Самарская область | 467 | 1,5% |
Республика Татарстан | 450 | 1,5% |
Краснодарский край | 426 | 1,4% |
Республика Башкортостан | 325 | 1,1% |
Приморский край | 309 | 1,0% |
Ростовская область | 305 | 1,0% |
Обращения к сайту из других регионов составляют менее процента от общего числа и потому в таблице 5 не отражены.
В значительной мере посетители обращаются к ИС АРАН вследствие запросов через поисковые системы. За год поисковые системы обеспечили свыше 23 тыс. переходов (около 100 в месяц) на материалы сайта isaran.ru. При этом лидером формирования запросов пользователей, привлеченных на isaran.ru, является поисковая система google, оставившая позади yandex и прочие поисковики. Результаты статистики с 29 ноября 2013 г. по 29 ноября 2014 г. представлены в нижеследующей таблице.
Таблица 6. Обращения пользователей к isaran.ru через поисковые системы
Поисковая система | Переходов | Доля | Среднее за месяц |
---|---|---|---|
Всего | 23364,0 | 100,0% | 99,8 |
google.com | 13308,0 | 57,0% | 57,5 |
yandex.ru | 7341,0 | 31,4% | 33,4 |
mail.ru | 1261,0 | 5,4% | 4,5 |
images.google.com | 1210,0 | 5,2% | 3,3 |
rambler.ru | 172,0 | 0,7% | 0,9 |
images.yandex.ru | 31,0 | 0,1% | 0,0 |
bing.com | 20,0 | 0,1% | 0,1 |
nigma.ru | 20,0 | 0,1% | 0,1 |
Вместе с тем, посещаемость isaran.ru пользователями социальных сетей можно охарактеризовать как весьма низкую: почти за два года (с 1 января 2013 г. по 29 ноября текущего) в HotLog зарегистрированы всего 197 переходов на сайт из социальных сетей. Из них большинство приходятся на сети Vkontakte (102 перехода), Facebook (60) и Livejournal (15). В процентном отношении распределение переходов иллюстрирует прилагаемая ниже диаграмма.
Рис. 3. Посещаемость isaran.ru пользователями социальных сетей (1.01.2013-29.11.2014)
Эти данные позволяют полагать, что спрос на содержательную научную информацию у пользователей социальных сетей в значительной мере недонасыщен, и привлечение этих пользователей может способствовать повышению интереса широкой аудитории к ресурсам ИС АРАН.
1.3. ИС АРАН в социальной сети
Для возможного продвижения ИС АРАН в соцсетях следует прежде изучить опыт деятельности других архивных учреждений на соответствующих интернет-площадках. Как выясняется, ряд архивов США и Западной Европы активно используют для привлечения пользователей к своим ресурсам социальную сеть Facebook — такой выбор, очевидно, объясняется тем, что эта соцсеть относится к крупнейшим в мире, — она насчитывает 1,32 млрд зарегистрированных пользователей, а ее мировая суточная аудитория составила в марте текущего года 720 млн человек. Архивные учреждения используют Facebook для информирования пользователей о новостях и памятных датах фондообразователей, сведениях о раскрытии фондов, публикаций оцифрованных документов и целых коллекций, материалов выставок и т.п. Одновременно площадка Facebook используется как интерактивная контактная среда, в которой пользователи сети выражают свои впечатления о прочитанном, или увиденном в представленных архивом документах. В следующей таблице отражены сведения о деятельности и популярности некоторых архивов в Facebook по состоянию на 31 октября 2014 г.:
Таблица 7.
Архивный ресурс на Facebook | Дата создания | Подписчики / Участники обсуждений обновлений | Регулярность обновлений |
---|---|---|---|
Archives nationales (France) | Декабрь 2011 | 7853 / 359 | ~1-2 раза в день |
Archives départementales de la Manche | Декабрь 2010 | 6760 / 518 | ~1-2 раза в день |
The National Archives (UK) | Июнь 2008 г. | 12,7 тыс. / 211 | С осени 2009 г. – раз в неск. дней |
US National Archives | 2009 г. | 94126 / 9 тыс. | ~1 раз в день |
Из приведенных данных следует, что по интенсивности вовлечения пользователей страница учреждения на Facebook может быть вполне сопоставима с деятельностью профильного сайта и привлекать тысячи подписчиков, получающих в регулярном режиме информацию об архивных новостях. Так, Национальный архив США по масштабам активности в Facebook может быть сравним с крупными СМИ.
Следует отметить, что деятельность российских архивных учреждений в Facebook отражена значительно скромнее. Так, страница РГАЛИ, обновляющаяся в среднем один-два раза в неделю, привлекла 1849 подписчиков (данные на конец ноября 2014 г.). РГИА представлен сразу в двух ипостасях: в качестве страницы, которую ведет от имени архива частное лицо, регулярно обеспечивая обновления страницы, и собрав благодаря этому 201 подписчика; и группы по интересам в количестве 303 человек, которую поддерживает официальный представитель архива. Таким образом, регулярная совокупная аудитория РГИА в Facebook пока насчитывает немногим более 500 человек.
Заключение
Ключевой вывод анализа оn-line активности ИС АРАН состоит в том, что социальный трафик, в отличие от прямого и поискового трафика, фактически является единственной разновидностью объема передаваемой информации, который в существующих условиях состояния и развития системы может быть повышен, а в перспективе обеспечить и рост референциального трафика. Наблюдения над деятельностью различных архивных организаций в социальной сети Facebook позволяют полагать, что использование этого ресурса для продвижения ИС АРАН может в течение 2015 г. сформировать собственную заинтересованную аудиторию не менее чем в несколько сотен человек. Для этого необходима информационная поддержка ресурса в режиме регулярных (не реже, чем еженедельных) обновлений с обязательным воспроизведением публикуемого на Facebook контента на основном сайте isaran.ru.
[1] Обзор методологических принципов вебометрики применительно к веб-ресурсам учреждений науки содержится в работе: Антопольский А.Б., Поляк Ю.Е., Усанов В.Е. О российском индексе вебсайтов научно-образовательных учреждений // Информационные ресурсы России. 2012. № 4. С. 2-7.
[2] Принципы составления рейтинга описаны на сайте проекта : http://research.webometrics.info/en/Methodology