Какие из перечисленных данных являются вторичными
SQL (Structured Query Language, язык структурированных запросов) является основным средством управления и обращения с запросами к данным, хранящимся в базах данных. Также иногда встречаются структурированные данные, которые достаточно трудно сохранить в традиционной реляционной базе данных (один из примеров — иерархические данные, например генеалогическое дерево).
Впрочем, мир не состоит из структурированных данных; просто это представление удобно для человека и машин. Чаще реальные данные хранятся в неструктурированном виде. Неструктурированные данные трудно подогнать под конкретную модель данных, потому что их содержимое зависит от контекста или имеет переменный характер. Один из примеров неструктурированных данных — обычные сообщения электронной почты:
Хотя сообщение содержит структурированные элементы (отправитель, заголовок, тело), одни и те же задачи могут решаться множеством разных способов, например, существует бесчисленное количество вариантов упоминания конкретного человека в сообщениях. Проблема дополнительно усложняется существованием тысяч языков и диалектов.
Сообщение электронной почты, написанное человеком (наподобие показанного выше), также является идеальным примером данных на естественном языке.
Данные на естественном языке составляют особую разновидность неструктурированных данных; обработка таких данных достаточно сложна, потому что она требует знания как лингвистики, так и специальных методов data science.
Сообщество обработки данных на естественном языке добилось успеха в области распознавания сущностей, распознавания тематических областей, обобщения, завершения текста и анализа эмоциональной окраски, но модели, адаптированные для одной предметной области, плохо обобщаются для других областей. Даже самые современные методы не смогут расшифровать смысл произвольного фрагмента текста. И этот факт вряд ли кого-то удивит: у людей также возникают проблемы с восприятием естественного языка. Он неоднозначен по своей природе. Сама концепция смысла выглядит спорно. Два человека слушают один разговор; вынесут ли они одинаковый смысл из него? Даже смысл отдельных слов может изменяться в зависимости от настроения говорящего.
К машинным данным относится информация, автоматически генерируемая компьютером, процессом, приложением или устройством без вмешательства человека. Машинные данные становятся одним из основных источников информации, и ситуация вряд ли изменится. Wikibon предсказывает, что рыночная стоимость промышленного Интернета (термин, предложенный компанией Frost&Sullivan для обозначения совокупности сложного физического оборудования с сетевыми датчиками и программным обеспечением) к 2020 году составит приблизительно 540 миллиардов долларов. По оценкам IDC (International Data Corporation), количество узлов сети к 2020 году в 26 раз превысит численность населения. Эта сеть часто называется Интернетом вещей.
Анализ машинных данных из-за их громадных объемов и скоростей сильно зависит от инструментов с высокой масштабируемостью. К примерам машинных данных относятся журналы веб-серверов, записи детализации звонков, журналы сетевых событий и телеметрии:
Машинные данные на рисунке выше хорошо укладываются в структуру классической базы данных. Это не лучший формат для данных с высокой степенью связности или «сетевых» данных, в которых достаточно значимую роль играют отношения между сущностями.
Термин «графовые данные» может сбить с толку, потому что любые данные могут быть представлены в виде графа. Под «графом» в данном случае имеется в виду понятие графа из математической теории графов — математическая структура для моделирования попарных отношений между объектами. Вкратце, в графовых, или сетевых, данных особое внимание уделяется связям или смежности объектов. Графовые структуры данных используют узлы, ребра и свойства для представления и хранения графических данных. Графовые данные естественным образом подходят для представления социальных сетей, а их структура позволяет вычислять такие специфические метрики, как влияние участников и кратчайший путь между двумя людьми.
Примеры графовых данных встречаются на многих веб-сайтах социальных сетей. Например, в LinkedIn можно увидеть, кого вы знаете в той или иной компании. Ваш список читателей в Твиттере также является примером графовых данных. Сила и мощь связанных данных проявляется при анализе нескольких перекрывающихся графов, построенных на одних и тех же узлах. Например, представьте, что ребра обозначают «друзей» на Facebook. А теперь возьмем другой граф с теми же людьми, но связывающий коллег по бизнесу через LinkedIn, и третий граф, основанный на интересе к фильмам на Netflix. Наложение этих трех графов позволит получить ответы на многие интересные вопросы.
Для хранения графовых данных используются графовые базы данных, а для построения запросов к ним — такие специализированные языки запросов, как SPARQL.
Работа с графовыми данными создает специфические проблемы, причем для компьютера эта задача становится еще сложнее.
Аудио, видео и графика — типы данных, ставящие непростые задачи перед специалистом data science. Задачи, тривиальные с точки зрения человека (например, распознавание объекта на картинке), оказываются сложными для компьютера. В 2014 году компания MLBAM (Major League Baseball Advanced Media) объявила, что объем записываемых видеоматериалов для одного бейсбольного матча будет увеличен приблизительно до 7 Тбайт с целью проведения оперативного анализа. Высокоскоростные камеры на стадионах записывают движения мяча и спортсменов для того, например, чтобы вычислять в реальном времени траекторию движения защитника.
Недавно компании DeepMind удалось создать алгоритм, который способен обучаться играть в видеоигры. Алгоритм получает на входе содержимое экрана и учится интерпретировать эти данные в сложном процессе глубокого обучения. Это замечательное достижение, и компания Google приобрела DeepMind для разработки искусственного интеллекта. Алгоритм обучения получает данные, генерируемые компьютерной игрой, т. е. потоковые данные.
Потоковые данные могут принимать почти любую из перечисленных форм, однако у них имеется одно дополнительное свойство. Данные поступают в систему при возникновении некоторых событий, а не загружаются в хранилище данных большими массивами. И хотя формально они не являются отдельной разновидностью данных, мы выделяем их в особую категорию, потому что вам придется приспособить свой рабочий процесс для работы с потоковой информацией.
Примерами потоковых данных могут служить раздел «Что происходит?» в Твиттере, прямые трансляции спортивных и музыкальных мероприятий и данные биржевых котировок.
Вторичные данные как информационный ресурс: специфика и порядок работы Текст научной статьи по специальности «Компьютерные и информационные науки»
Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стрельникова Анна Владимировна
В статье проанализированы достоинства и недостатки основных источников вторичных данных: государственной статистики, результатов предшественников и документов (текстов). Сделан вывод о том, что тексты являются наиболее перспективным источником данных с точки зрения вторичного анализа, так как текстовая информация дает уникальную возможность многократного обращения к ней. Также в статье описываются этапы подготовки к вторичному анализу, приводятся примеры стратегий работы с вторичными данными.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Стрельникова Анна Владимировна
Контент-анализ больших качественных данных
Методология анализа и интерпретации эмпирических данных социологических исследований
Панельные исследования в истории и социологии: особенности первичных данных
Методы анализа текста в смешанном дизайне исследования
Большие данные в социологии: новые данные, новая социология?
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Secondary data as information resource: The specificity and working stage
The article deals with the advantages and disadvantages of the main sources of secondary data : official statistics, the results of previous researchers and documents (texts). It is concluded that the texts are the most promising source of data in terms of secondary analysis as well as the text provides a unique opportunity to repeated appeals to her. Also in the article describes the stages of preparation for the secondary analysis, are examples of strategies for working with secondary data .
Текст научной работы на тему «Вторичные данные как информационный ресурс: специфика и порядок работы»
ВТОРИЧНЫЕ ДАННЫЕ КАК ИНФОРМАЦИОННЫЙ РЕСУРС: СПЕЦИФИКА И ПОРЯДОК РАБОТЫ
В статье проанализированы достоинства и недостатки основных источников вторичных данных: государственной статистики, результатов предшественников и документов (текстов). Сделан вывод о том, что тексты являются наиболее перспективным источником данных с точки зрения вторичного анализа, так как текстовая информация дает уникальную возможность многократного обращения к ней. Также в статье описываются этапы подготовки к вторичному анализу, приводятся примеры стратегий работы с вторичными данными.
Ключевые слова: социологические данные, анализ данных, вторичный анализ данных, методология анализа данных.
Информационный ресурс эмпирического исследования в социологии может быть представлен первичными и вторичными источниками данных. При этом выбор тех или иных методов анализа обычно определяется, исходя из характера данных (количественные базы данных, транскрипты и т. д.) и предполагаемой формы конечного «продукта» исследовательской работы (отчета, научной статьи и т. д.).
Говоря о социологических эмпирических данных, обычно выделяют следующие их разновидности:
1) совокупность чисел, характеризующих те или иные объекты;
2) множество индикаторов определенных отношений между рассматриваемыми объектами;
3) результаты попарных сравнений респондентами каких-либо объектов;
4) совокупность определенных высказываний;
5) тексты документов;
© Стрельникова А.В., 2010
6) так или иначе зафиксированные результаты наблюдения за невербальным поведением и т. п.1
Все перечисленные разновидности информационного ресурса эмпирического исследования могут выступать в роли вторичных данных. Сгруппируем их по потенциальным источникам. Это государственная статистика, результаты массовых опросов (данные предшественников) и документы (тексты). Рассмотрим по порядку их достоинства и недостатки.
1. Источники вторичных данных
Государственная статистика. Государственная статистика аккумулирует обобщенные социальные показатели по регионам, отраслям, социальным группам. Полученные данные издаются в виде справочников, аналитических записок, отчетов.
Основным достоинством государственной статистики как вторичного источника является регулярность предоставления данных и их широкая доступность, а также длительный опыт накопления материалов, что позволяет сравнивать разные исторические периоды. Статистические показатели в большинстве случаев уже сгруппированы, нормированы и поэтому достаточно наглядны. Соответственно, их анализ не представляет серьезных трудностей.
Однако у государственной статистики имеется и ряд недостатков. Так, из советского времени идет представление о государственной статистике, как о малодоступном и малонадежном источнике информации. Например, В. Воронков утверждает, что в СССР статистические данные были непригодны для использования из-за повсеместных искажений, в особенности по сельскому хозяйству и вооруженным силам2.
Оценивая достоверность как доступной, так и секретной статистики советского времени как крайне низкую, текущее состояние дел считают еще более плачевным. Пессимизм обусловлен тем, что рыночные преобразования разрушили саму систему организации статистики, систему обязательного предоставления отчетности. В результате мы имеем многочисленные свидетельства о приписках и подлогах даже при проведении Всероссийской переписи на-селения3. Поэтому неудивительно, что исследователи, так или иначе посвященные в практику сбора статистических сведений, называют статистику «главным поставщиком артефактов для политизированной дискуссии о российском обществе»4.
Многие исследователи отмечают, что полезность статистических данных является сомнительной, потому что они попросту многое не учитывают. Действительно, на базе статистических трендов
невозможно объяснить серьезные социокультурные трансформации последнего столетия. По мнению З. Баумана, «статистика не схватывает размаха возможностей и беспомощна в отношении динамики их саморазвития и столкновения. все крупные, действительно существенные перемены в нашем столетии произошли неожиданно, ни один из них нельзя было предвидеть и дедуцировать заранее из статистических трендов. ». Помимо этого, одним из минусов использования данного информационного ресурса является существенное запаздывание по срокам: в ряде случаев с момента сбора данных и до их обнародования проходит не меньше года. Поэтому такие данные не пригодны, например, для аналитических обзоров текущей общественно-политической ситуации в стране.
Исходя из вышеизложенного, статистические данные в качестве вторичных источников можно применять ограниченно. Их следует дополнять перекрестными данными из массовых или экспертных опросов, соответствующих документов и т. д.
Результаты массовых опросов (данные предшественников). К этой группе источников мы относим всевозможные результаты социологических обследований, независимо от того, кто их проводил (исследовательская фирма, академический институт, коммерческая организация). Г.Г. Татарова5 предлагает более дробную структуру, разделяя данные предшественников на три группы: данные, полученные с помощью вопросников сложной структуры; данные, полученные с помощью вопросников простой структуры; данные бюджетов времени. При этом под вопросниками простой структуры она подразумевает массовые анкеты по изучению общественного мнения (маркетинговые опросы, различные мониторин-ги и т. д.). В отличие от них, вопросники сложной структуры содержат многоуровневые блоки вопросов (например, по выявлению установок, ценностных ориентаций) и применяются в исследованиях аналитического характера. Для нас основной критерий отнесения в эту группу — наличие данных, выраженных в цифровой форме (собственно баз данных, линейных распределений, мер средней тенденции для групп), поэтому подгруппы по типам вопросников мы не рассматриваем.
Как вторичный источник данные предшественников предпочтительны в тех случаях, когда требуются регулярные описания динамики социально-экономических, социально-политических и других показателей, которые на протяжении длительного времени интерпретируются и переводятся на операциональный уровень по одним и тем же типичным схемам6 у большинства исследователей. Удобны они и для использования в учебных целях, например в курсах по анализу данных с применением программного пакета SPSS.
Рассмотрим отрицательные стороны этого источника вторичных данных, которые заставляют более сдержанно относиться к его использованию. Это, в первую очередь, рассогласованность выборочной и генеральной совокупностей, проявляющаяся в смещении группообразующих критериев. Так, большинство массовых опросов по-прежнему опираются на традиционные социально-демографические критерии отбора респондентов, в то время как в современном российском обществе одни из них потеряли актуальность, а другие пришли на смену старым. Исследователи-прикладники отмечают, что внутригрупповые различия в стилях жизни и ценностные установки часто более существенны, нежели межгруп-повые7. Второе возражение связано с таким свойством массовых опросов, как нивелирование индивидуальных различий и субъективных характеристик исследуемых людей и групп. Наконец, третье возражение связано с сомнением в достоверности данных массовых опросов. Считается, что в последнее десятилетие опросы становятся не столько выражением реального мнения общества, сколько пропагандистской подготовкой к результатам выборов. Отметим, что особые нарекания вызывают политические прикладные исследования, в которых социологические опросы и их интерпретация стали «эффективным, не только оборонительным, но и наступательным, оружием»8. Однако выявленные недостатки не являются препятствием для использования результатов массовых опросов в качестве вторичного источника. Было бы неразумно исключать из рассмотрения такой большой и постоянно пополняющийся сегмент исследовательских материалов, как результаты предшественников. Поэтому перечислением недостатков мы указываем, прежде всего, на необходимость проверки и сопоставления подобных данных перед использованием.
Документы (тексты). К данной группе вторичных источников мы относим документы и тексты (в широком смысле)9. Основными характеристиками текстов является их знаковая природа (принадлежность к специфической знаковой системе) и наличие определенной информации, которая передается посредством данного текста в явной или скрытой форме10. По типу данных это могут быть печатные и рукописные документы (отчеты, стенограммы, письма, записки, дневники); аудио-, фото- и видеодокументы (кассеты с записью интервью, фотографии); вещественные свидетельства (личные вещи). По содержанию это могут быть биографические данные (личные документы, интервью), дневники наблюдений, ответы на открытые анкетные вопросы, экспертные заключения. Как следует из приведенных примеров, огромные массивы текстовых данных представляют собой опосредованное отражение действительности
и могут аккумулироваться преимущественно с помощью «мягких» (качественных) методов.
Тексты могут создаваться как независимо от исследователя, так и по его инициативе. В первом случае исследователь не может влиять на содержание и качество текстовой информации (эта информация предоставляется независимым от исследователя источником данных), во втором случае текст является непосредственным продуктом взаимодействия с объектом исследования (например, стенограмма глубинного интервью). Существует и третий тип текстов, которые полностью создаются исследователем (дневник наблюдений, этнографическое исследование). Каждый из этих видов текстов характеризуется собственными познавательными и аналитическими возможностями.
Многообразие документов и текстов как потенциальных вторичных данных является одновременно и достоинством, и недостатком. Достоинство заключается в богатстве смыслов, которое можно почерпнуть в этом многообразии. Недостаток заключается в необходимости работы с огромным потоком неструктурированной информации. Поэтому перед использованием текстовых данных следует обязательно продумать процедуры кодирования (объединения единиц анализа текста в обобщенную категорию или класс с приписыванием кодового значения) и упорядочить этот поток.
Поскольку кодирование служит цели определения места данных в общей картине изучаемой реальности, следует соотносить каждый этап группировки и присвоения кодов с исследовательскими задачами. Как справедливо замечено Ю.Н. Толстовой, никакой «поток сознания» не позволит нам говорить о научных выводах, если мы в этом «потоке» не выделили некоторые «жесткие» логические конструкты11. Соответственно, анализ такой информации — дело настолько же увлекательное, насколько и сложное. В большинстве случаев, все сводится к интерпретации текстов. Например, В.В. Семенова вслед за К. Гирцем12 предлагает использовать тактику плотного (или насыщенного) описания, в которой кроме фиксации самого события или отношения могут быть выделены: а) его контекст; б) субъективная значимость происходящего для участников действия; в) каким образом происходил процесс13. С. Квале говорит о последовательности самопонимания, критического понимания с позиций здравого смысла, и теоретического понимания14.
В интерпретации текстов полезными оказываются не только творческая интуиция и приемы аналитического раскрытия субъективных смыслов, но и обращение к соответствующим теориям текстовой интерпретации, в особенности к герменевтическому направлению.
Трактовка предмета гуманитарного познания как текста стала оформляться в философии языка В. Гумбольдта и Ф. Шлейермахе-ра. Для нашего исследования принципиально важным является тот факт, что родоначальники этого направления (в особенности Ф. Шлейермахер) уделяли большое внимание тем текстам, которые отделены от исследователя историческими, культурными, языковыми барьерами (так называемые тексты-памятники), тем самым указывая на приоритетность социально-исторического направления в интерпретации текстов. Ф. Шлейермахером (и позднее В. Дильтеем) была определена проблематика универсальной герменевтики — направления, стремившегося представить все формы человеческой деятельности как символические тексты, порождаемые в контексте данной культуры и имеющие бесконечное множество прочтений и интерпретаций. Смысл этих текстов чаще всего скрыт от субъекта познания, и его надо распознать, дешифровать, усвоить, проинтерпретировать. При этом обращается внимание на исторический и социокультурный контекст: «Если слово есть принцип культуры, то принципы анализа слова должны быть последовательно распространены на анализ культуры»15.
Принципы универсальной герменевтики последовательно развивались А. Уайтхедом, Г. Гадамером, П. Рикером. А. Уайтхед и Г. Гадамер обозначили особенности логики понимания (понимание как присвоение смысла, полученного в результате объяснения). П. Рикер заострил внимание на проблеме диалектики объяснения и понимания в контексте реконструкции текста как целого. Он подчеркивал посредническую роль текста (диалог между интерпретатором и создателем текста), из которой, в частности, следует, что при интерпретации текста имеет большое значение правильная методика формулировки вопросов по отношению к нему. Поскольку объяснение опирается на гипотезы, реконструирующие смысл текста как целого, возможности для его интерпретаций понимаются как ограниченные только позицией интерпретатора16.
А. Страус и ряд других исследователей предлагают использовать многоступенчатую процедуру кодирования текстовой информации: открытое, осевое и выборочное кодирование, которые соответствуют нескольким этапам прочтения текста17. Смысл такого многоступенчатого кодирования заключается в постепенном сужении поля анализа: от предельно открытого поиска смысловых единиц текста до узконаправленного, наиболее соответствующего замыслу исследователя. Так, на этапе открытого кодирования выделяются тематические категории, которые вытекают из общих исследовательских вопросов и находятся на очень низком уровне абстракции. Затем исследователь должен составить общий список
выявленных тем (они могут и расширять исходные исследовательские задачи) и продолжать работу по их конкретизации. Осевое кодирование подразумевает поиск контекстуальных связей между выделенными категориями (устанавливаются причинно-следственные связи, условия появления ключевых категорий и т. д.). Выборочное кодирование подразумевает последнее прочтение текста уже с учетом выстроенных категорий и служит для поиска наиболее ярких эпизодов для сравнения частей анализируемого текста.
Мы считаем, что документы и тексты являются наиболее перспективным источником данных с точки зрения вторичного анализа. Текстовая информация дает уникальную возможность многократного обращения к ней и поэтапного решения тех или иных задач. Богатый интерпретативный ресурс документов и текстов особенно эффективен, когда в фокусе исследования «история» одного социального объекта, отдельной личности или малой группы, мотивы, поступки и приписываемые этим поступкам смыслы, когда особую важность имеет исторический контекст социальных действий.
2. Подготовка к работе с вторичными данными
Вторичным анализом называют анализ с использованием вторичных данных, который предоставляет «интерпретации, выводы или знание, дополнительное или отличное от предоставленного в первом отчете по исследованию в целом и его основным резуль-татам»18. Иными словами, это решение новых задач на базе старых (вторичных) данных. Основная цель вторичного анализа принципиально не отличается от целей любого другого анализа. Это поиск закономерностей, связей между переменными или, в более общем смысле, уменьшение размерности данных, их уплотнение в соответствии с определенными критериями.
С помощью вторичного анализа возможно решение как методических, так и содержательных задач. Это в первую очередь сравнение результатов нескольких исследований; обобщение данных (что называют также метаанализом); изучение временной и территориальной динамики социальных процессов; сравнение различных методик сбора и анализа данных. Например, в исследовании Н.М. Хазеевой «Рейтинг 100 ведущих политиков России: методическая экспертиза» помимо выявления латентных факторов оценки влиятельности российских политиков проведена детальная оценка качества измерительных процедур, а также даны рекомендации для повышения надежности исследований с примене-
нием рейтинговых методик и экспертных оценок. В исследовании М.М. Малышевой «Профессиональная работа женщин и демографическое поведение: опыт вторичного анализа международных сравнительных исследований» изучается динамика положения женщин на рынке труда в межстрановой и временной перспек-тиве19. В работах по электоральной социологии И. В. Задорина («Экспертный сценарно-прогностический мониторинг: методологические основания и организационная схема»), Г.М. Орлова и В.Г. Шуметова («Модель электоральных предпочтений: методология построения»), О.Е. Трущенко («Использование вторичного анализа выборочных опросов в социально-проектных исследованиях») предлагаются методические рекомендации к использованию данных социально-политических опросов и экспертных оценок, описываются основные приемы моделирования в политических исследованиях20. Таким образом, помимо экономии ресурсов (что также является немаловажным преимуществом) использование вторичных данных позволяет решать серьезные научные задачи. Более того, уровень обоснованности научных выводов при вовлечении в исследование вторичных данных становится на порядок выше, так как статистическая база в нем может многократно возрастать по сравнению со «срезовым» эмпирическим исследованием и появляется возможность сопоставления согласованных или противоречащих научных результатов, обеспечиваются условия для более корректного использования математико-статисти-ческих процедур.
При проведении исследования на основе вторичного анализа предлагается придерживаться следующей схемы:
1) четко определиться со спецификой проблемы исследования;
2) подготовить предварительный план исследования;
3) отобрать подходящие данные в соответствии с проблемой исследования;
4) провести первичный анализ (например, закодировать данные, если они находились в архиве в исходном состоянии). Грамотная кодировка и инвентаризация материалов особенно актуальна, если данные являются разнородными (письма, интервью, числовые данные и т. д.) и собирались для других целей;
5) осуществить необходимые преобразования данных;
6) оценить полноту данных и при необходимости провести дополнительный поиск или сбор данных21.
Эффективное использование вторичных данных в социологическом исследовании подразумевает тщательное изучение выбранных массивов с целью оценки их релевантности, полноты, надежности. Исследователю необходимо составить подробное описание исход-
Различие в этапах исследования при использовании первичных и вторичных данных
ных данных и процедур, которые были использованы для приведения данных в соответствие с текущими целями исследования.
Существуют некоторые общие критерии для отбора вторичных данных. Так, Г.И. Саганенко предлагает оценивать пригодность вторичных данных по критерию доступности и надежности. В исследованиях, которые ориентированы на прогноз, критерий надежности исходной информации должен соблюдаться особенно строго22. Что касается доступности данных, то выделение этого критерия, на наш взгляд, является особенно важным в российском контексте: доступность напрямую связана не только с наличием соответствующих источников, но и с умением грамотно их искать. Надежность количественных данных проверяется посредством соответствующих статистических процедур и выявлением воз-
можных источников смещений. Что касается надежности данных «качественного» исследования, то она обеспечивается следующими действиями исследователя: соотнесением вторичных данных с реальными событиями, с аналогичными обстоятельствами в жизни других людей, с другими источниками информации и выявлением противоречий.
Для повышения надежности результатов при исследовательской интерпретации данных применяется метод триангуляции -перекрестной интерпретации некоторого фрагмента а) разными исследователями, б) при помощи разных методов, в) посредством сопоставления данной ситуации с аналогичными результатами предшественников, г) посредством повторения результатов на том же объекте через определенный промежуток времени23. Однако противоречия, обнаруженные в ходе такой проверки, не всегда свидетельствуют о непригодности рассматриваемых данных. Например, если респонденты в исходном исследовании по каким-либо причинам давали недостоверную информацию, то анализ этой недостоверности может привести к интересным и содержательным выводам. С. Квале приводит один из таких примеров: жительницы трущоб красочно рассказывали в интервью о грубом унизительном поведении социальных работников, которые их обслуживали, однако эта информация не подтверждалась при проверках. Исследователь решил разобраться и пришел к заключению, что таким экспрессивным способом депривированные члены общества пытаются как-то поддержать свое самоуважение, компенсировать свою зависимость. Этот вывод послужил уточнению гипотез и изменил направленность исследования24.
Для корректного использования вторичных данных важно иметь как можно более полное представление об исходном исследовании (об особенностях выборки, о методах сбора данных, о квалификации исследовательской организации и т. д.). Это помогает выявить возможные ошибки предшественников на той или иной стадии сбора данных, что позволит их оценить и по возможности скорректировать.
На текущий момент наиболее развит анализ вторичных данных в социально-исторических (историческая социология, традиция «устной истории») и социально-демографических исследованиях. Как показывает практика, изменениям во времени подвержены и отдельные показатели, и взаимоотношения между переменными. Поэтому введение в исследование исторического контекста связано с признанием ограниченного применения «срезовых» опросов, особенно если дело касается прогнозных целей, изучения причинных связей.
Потребность анализировать данные во временной перспективе породила появление особой — лонгитюдной — исследовательской стратегии, в соответствии с которой данные получаются многократно, в разные моменты времени и часто агрегируются с родственными массивами данных. Разновидности этой стратегии -трендовые, панельные и когортные обследования. При трендовом обследовании проводятся регулярные замеры на выборках, которые строятся из одной и той же генеральной совокупности. При панельном обследовании, введенном в социологическую практику еще К. Лазарсфельдом, проводятся регулярные замеры на одной и той же выборке, «панели». При исследовании когорт отбор респондентов производится из одной специфического группы (например, люди одного и того же года рождения; люди, в определенный год окончившие школу, и т. д.). Измерения («волны») в разные периоды жизненного цикла выделенной когорты позволяют обнаружить перемены в установках, стилях жизни, а в панельных исследованиях, помимо этого, еще и проверить сложные причинные гипотезы с высокой степенью надежности.
3. Data mining: работа с большими массивами вторичных данных
Появление новых направлений в развитии средств и методов обработки и хранения данных обусловлено общим увеличением совокупного массива информационных ресурсов, усложнением их структуры, потребностью в более эффективных аналитических решениях.
Термин data mining можно перевести как «извлечение информации» или «добыча данных». Проблематика data mining, от круга приоритетных исследовательских задач до особенностей практического применения, нашла детальное отражение в работах таких зарубежных авторов, как Р. Блэкхаус, М. Лавелл, Т. Мейер, С. Перес, K. Хувер. Быстрое развитие данного направления в зарубежной исследовательской практике обусловлено высокой актуальностью задач, для решения которых оно предназначено: в определенный момент накопленные информационные ресурсы (как научной, так и коммерческой информации) стали слишком большими для реализации традиционных методов анализа. На больших объемах неоднородных данных (массивы лонгитюдных и кросс-культурных исследований, временные ряды и т. д.) обычные статистические процедуры не всегда эффективны. Проблемы работы с большими массивами встают особенно остро, когда они содержат в себе данные разной степени структуризации: изображения, тексты
интервью, преобразованные числовые данные и т. д., а также когда накопление данных происходило в разные временные периоды (это особенно актуально в условиях стремительного развития информационных технологий и появления альтернативных / конкурирующих программных продуктов и методов обработки данных). Цель data mining состоит в проработке методологии по обращению с подобными данными и в ее практическом применении, то есть в выявлении скрытых правил и закономерностей в наборах таких данных.
Процедуры извлечения данных в самом общем виде повторяют те же шаги, которые проходит исследователь при традиционном анализе данных. Работа начинается с поиска релевантного массива данных и проверки его на полноту, достоверность, надежность. Далее происходит при необходимости вычищение, преобразование имеющихся данных в соответствии с задачами исследователя. После этого задается поиск корреляционных структур, оценка зависимостей между параметрами при условии изменения некоторых модельных параметров. Эти процессы задаются специальными алгоритмами, позволяющими искать закономерности в нескольких структурах данных одновременно, причем возможности специализированных программных пакетов по data mining таковы, что позволяют обрабатывать около миллиона входных переменных с целью определения предикторов для регрессии или классификации25.
Благодаря процедурам data mining становится возможным использование нескольких массивов со сложной структурой в качестве проверки теоретической модели. Специфика задач при работе с огромными массивами заключается в том, что объем и разнородность данных не дают возможности сформировать рабочие гипотезы. Поэтому распространенной задачей извлечения данных является поиск каких-либо элементов структуры, шаблонов данных, согласованных сгруппированных значений.
Таким образом, использование вторичных данных позволяет не только экономить материальные и временные ресурсы, но и решать серьезные научные задачи. Введение в оборот вторичных данных дает возможность сопоставления научных результатов, позволяет обеспечить условия для более корректного использования матема-тико-статистических процедур. Водораздел между использованием первичных и вторичных данных пролегает между отбором и инвентаризацией релевантных данных. Если в первичном исследовании полевые данные заведомо являются «подходящими», то для вторичного анализа необходимо не только осуществить отбор релевантных массивов, но и провести серьезную работу с этими масси-
вами. Использование вторичных данных является логичным и закономерным при проведении многоцелевых, междисциплинарных исследований.
1 Татарова Г.Г. От постулатов эмпирической социологии к методологии анализа данных // Социология: 4М. 1999. № 11. С. 51-71.
2 Воронков В. За пределами публичного пространства (рефлексия социолога) // Неформальная экономика. Россия и мир / Под ред. Т. Шанина. М.: Логос, 1999. С. 84-94.
3 Калимуллин Т.Р. Как проходила перепись населения в 2002 г.: наблюдения участников // Экономическая социология. 2003. Т. 4. № 1. С. 147-157.
4 Воронков В. Указ. соч. С. 84-94.
5 Татарова Г.Г. Методология анализа данных в социологии: (Введение). 2-е изд., испр. М.: Nota Bene, 1999.
6 Например, удовлетворенность работой традиционно разбивают на такие эмпирические индикаторы, как удовлетворенность заработной платой, удовлетворенность отношениями с коллегами, удовлетворенность отношениями с начальством, удовлетворенность оборудованием рабочего места и т. д. Однако далеко не все социальные показатели могут интерпретироваться столь однозначно.
7 Задорин И.В. Экспертный сценарно-прогностический мониторинг: методологические основания и организационная схема // Вопросы социологии. 1994. Вып. 5. С. 27-49.
8 Воронков В. Указ. соч. С. 84-94.
9 В. Кузнецов, известный специалист в области философии языка, определяет тексты как знаково-символические информационные системы разнообразного происхождения и предназначения, которые «являются результатом познавательно-созидающей, творческой и производственной деятельности живых существ». См.: Кузнецов В. Герменевтика и ее путь от конкретной методики до философского направления // Логос. 1999. № 10. С. 44.
10 Там же. С. 43-89.
11 Толстова Ю.Н. Принципы анализа данных // Социология: 4М. 1991. № 1. С. 51-61.
12 К. Гирц подразделяет описания на «тонкие» (простая фиксация наблюдаемых фактов) и «плотные», которые подразумевают вхождение в систему смыслов исследуемых людей (носителей культуры) и их интерпретации. Особенность антропологического знания, по Гирцу, состоит в том, что теоретические выкладки должны быть связаны с интерпретациями культурных явлений; при отрыве от них теория становится слишком абстрактной.
13 Семенова В.В. Качественные методы: введение в гуманистическую социологию. М.: Добросвет, 1998.
14 Квале С. Исследовательское интервью / Пер. с англ. М.Р. Мироновой. М.: Смысл, 2003.
15 Кузнецов В. Указ. соч.
16 Рикер П. Конфликт интерпретаций. Очерки о герменевтике. М.: Медиум, 1995.
17 Квале С. Указ. соч.
18 Сычева В.С. Метод вторичного анализа // Социологические исследования. 1995. № 11. C. 46.
19 Малышева М.М. Профессиональная работа женщин и демографическое поведение: опыт вторичного анализа международных сравнительных исследований // Социологические исследования. 1984. № 2. С. 65-71.
20 Задорин И.В. Указ. соч.; Трущенко О.Е. Использование вторичного анализа выборочных опросов в социально-проектных исследованиях // Вопросы социального проектирования. М., 1990. C. 24-37.
21 Methods of life course research: Qualitative and quantitative approaches / Ed. by J.Z. Giele, G.H. Elder. L.: Sage Publications, 1998.
22 Саганенко Г.И. Компоненты надежности социологического исследования и проблема сравнимости // Сравнительный анализ и качество социологических данных. М.: ИСИ АН СССР, 1984.
23 Семенова В.В. Указ. соч.
24 Квале С. Указ. соч. С. 219-220.
25 Spanos A. Revisiting data mining: «hunting» with or without a license // Journal of Economic Methodology. 2000. No. 7. Vol. 2. P. 231-264.
Виды маркетинговых исследований: первичные и вторичные
Существует немало подходов к классификации маркетинговых исследований. Многие российские учёные предлагают классификацию, исходя из объектов исследования – потребители, конкуренты, товары, услуги и т. д. Некоторые же западные исследователи предлагают опираться на иную классификацию, исходя из способов получения информации. Итак, выделяют следующие виды маркетинговых исследований:
Первичные маркетинговые исследования
Это исследования, проводимые самой компанией c целью сбора информации для улучшения продуктов, услуг или каких-либо производственных функций. Первичными исследованиями также нередко называют полевые исследования, которые проводятся «с нуля» без использования какой-либо иной информации, добытой из других источников. При этом, информация может собираться как с помощью количественных, так и качественных методов. Первичные маркетинговые исследования – это наиболее распространенный тип, а также самый ценный. Их главное преимущество в том, что они отвечают только на конкретные вопросы, отсеивая нерелевантные проблемы.
Вторичные маркетинговые исследования
В отличие от первичных, цель этих исследований – не собирать информацию «с нуля», а полагаться на уже имеющиеся данные из нескольких разных источников. Это исследование фокусируется на информации, которая уже была собрана другими компаниями, и доступна для бесплатного или платного использования. При вторичных исследованиях принимаются во внимание различные источники, включая данные правительственных органов или иных официальных источников, а также авторитетных изданий – газет, журналов, публикаций в Интернете и т.д. Одним из преимуществ проведения вторичных маркетинговых исследований является то, что в основном, они бесплатные (или во всяком случае менее затратные, чем первичные) и отнимают гораздо меньше времени.
Методы, используемые при первичных маркетинговых исследованиях:
Фокус-группы
Метод заключается в том, что группа людей собирается в определённом месте, и обсуждает поставленную тему, отвечая на вопросы модератора, и выдвигая свои собственные мнения. Сегодня фокус-группы не обязательно проводить в определённом месте, можно созывать интернет-видеоконференции, что дешевле и удобнее. Важная особенность фокус-групп – выборка, так как собранных людей всегда должно что-то объединять (один возраст, пол, или какие-либо иные характеристики). Это качественные исследования, которые серьёзно помогают компании узнать много о своём клиенте, рыночных тенденциях и т д.
Опросы и анкетирования
Бессменный метод маркетинговых исследований, который проводится самыми разными способами – анкетами и опросными листами, обзорными интервью, картами качества обслуживания и т. д. Один из наиболее распространённых примеров использования этого метода – карточки обратной связи, которые выдаются клиентам в ресторанах вместе со счётом. Это самый простой способ узнать, удовлетворены ли люди качеством оказания услуг, какие изменения они хотели бы видеть и т. д. Опросы сегодня также проводятся в Интернете, что позволяет компаниям иметь постоянную обратную связь с клиентами, и анализировать её.
Наблюдение
Есть две основных методики наблюдений – через взаимодействие с предметом и наблюдения, и без взаимодействия с предметом. Этот метод относят к количественным исследованиям, поскольку исследователи оценивают и измеряют поведение респондентов или группы потребителей.
Эксперименты и тестирования
Этот метод первичного исследования включает в себя научные тесты с использованием переменных, построением гипотез и т. д. Это количественный тип исследования рынка, который может проходить как в контролируемых, так и в неконтролируемых условиях. Примером эксперимента может послужить следующая ситуация: компания создала три различных стиля упаковки определённого продукта, а затем пустила эту продукцию в продажу различным категориям потребителей. Спустя некоторое количество времени, она проанализировала продажи, и сделала вывод о наиболее предпочтительном стиле и дизайне упаковки.
Глубинное интервью
Бесспорно, качественный метод исследования, который основан на тесном взаимодействии модератора с одним респондентом. Глубинное интервью практически никогда не ограничивается заданным шаблоном вопросов, а может проходит в форме свободной беседы или дискуссии. Этот метод позволяет познавать глубинные предпочтения клиентов.
Методы, используемые при вторичных маркетинговых исследованиях:
Вторичные исследования основываются, главным образом, на сборе информации из различных источников, а затем её компиляции и анализе. Есть два основных типа источников вторичного рынка данных исследования:
Внутренние источники
Включают информацию, которая уже была собрана самой компанией и может оказаться полезной для будущих проектов и т.д. Для большинства предприятий этих источников не редко бывает достаточно, чтобы разрабатывать новые продукты и услуги.
Примеры:
- Балансовые отчёты (сводные таблицы) – они могут применяться затем, чтобы найти необходимую статистику и цифры, и применять их в итоге к текущей ситуации;
- Отчеты о прибылях и убытках – важны для того, чтобы изучить, какие продукты и услуги приносили выгодные результаты в прошлом;
- Инвентарные ведомости – также важный источник статистических данных, которые могут использоваться для построения прогнозов на будущее;
- Объемы продаж – любая компания хранит свои предыдущие показатели продаж, для того, чтобы было на что равняться в будущем.
Внешние источники
В том случае, если внутренние источники не приносят достаточного количества информации, компания может использовать внешние. Они представляют собой самые разные данные, собранные другими компаниям, занятыми как в сфере маркетинговых исследований, так и в других областях. Внешние источники – среда очень обширная и изменчивая, а потому к ним нужен правильный, и строго контролируемый подход.
Примеры:
- Правительственные источники – информация из них может быть полезна компании, если речь идёт о конкретном субъекте, население и рынок которого необходимо изучить.
- Университеты и колледжи – Некоторые исследования университетов в части рыночных процессов, социологии и прочего, могут принести массу полезной информации предприятию.
- Интернет — он является наиболее широко используемым источником для вторичных исследований, но имеет один существенный недостаток – содержит множество не заслуживающих доверия источников, с неполной или неточной информацией.
- Данные конкурентов — часто компании используют информацию о конкурирующих предприятиях, собранную как самостоятельно, так и посредством других фирм.
Существует также немало ошибок, которые могут допустить компании при работе с разными источниками
- Проведение только вторичных исследований Многие компании ограничиваются только вторичными исследованиями в угоду экономии времени, сил, денег и иных ресурсов. Однако важно знать, что первичное исследование может дать видение новых перспектив, отдалённых результатов, и помочь по-новому взглянуть на тот сегмент рынка, в котором работает компания. Такие важные вещи как ценности, психология, образ жизни и интересы клиентов, могут быть получены только путём первичных исследований.
- Проведение только первичных исследований Предприятия часто делают ошибку, тратя много времени на первичные исследования, и забывают, о том, что использование вторичных источников может оказаться полезным, и существенно сэкономить время. Вторичное исследование может предложить, к примеру, ценные статистические данные, так что компании не нужно будет тратить силы и время на проведение собственных расчётов.
- Использование только интернета для исследований В сети можно найти ценную информацию, но делая ставку только на неё, есть риск совершить серьёзную ошибку. Интернет не всегда может предложить надежные источники и полную информацию. Поэтому его использование должно быть строго дозировано, а источники проверены на достоверность.
- Ограниченность восприятия Люди видят то, что хотят видеть. Но в отношении маркетинговых исследований компания, которая управляет бизнесом, не должна позволять себе «туннельное зрение». Часто руководители предприятий, имея некоторую идею в голове, буквально «замыкают» себя в ней, не желая видеть, что находится за её пределами.
Тестовые задания по курсу «Основы информационной культуры личности» для учащихся 10-11 классов
Тестовые задания предназначены для проверки знаний и умений учащихся в области информационной культуры. Предложенная система тестовых заданий выполнена в соответствии с содержанием учебной программы «Основы информационной культуры личности» для учащихся 10-11 классов. Она ориентирована на проверку знаний понятийно-терминологического аппарата курса, а также на выявление и проверку умений по работе с информационными ресурсами, умения использовать основные алгоритмы информационного поиска как в традиционной (библиотечной), так и электронной среде. Особое внимание в системе тестовых заданий уделяется контролю за освоением учащимися способов и методов аналитико-синтетической переработки информации и технологии подготовки и оформления результатов самостоятельной учебной и научно-исследовательской работы.
Порядок следования тестовых заданий соответствует принятой в программе последовательности изложения учебного материала и предусматривает четыре раздела: «Информационные ресурсы общества и информационная культура»; «Основные типы информационно-поисковых задач и алгоритмы их решения»; «Аналитико-синтетическая переработка источников информации»; «Технологии подготовки и оформления результатов самостоятельной учебной и научно-исследовательской работы выпускников общеобразовательных учреждений».
Тестовые задания включают 60 заданий и ключи к ним. Предлагаемая система тестового контроля знаний и умений носит закрытый характер, что позволяет реализовать их в автоматизированном варианте и включает два варианта тестовых заданий:
1. Выбор одного правильного ответа из предложенных четырех вариантов (ответы пронумерованы, учащийся должен отметить один вариант ответа);
2. Установление последовательности действий (ответы не пронумерованы, учащийся должен установить цифрами порядок действий).
Данный вариант тестовых заданий может быть использован в режиме как вводного, так и итогового диагностирования.
Раздел I. Информационные ресурсы общества
и информационная культура
1. Материальный носитель с зафиксированной информацией, предназначенный для ее сохранения и передачи во времени и пространстве, пригодный для использования в документационных процессах, это:
01; источник информации
02; издание
03; документ
04; публикация
2. Если документ является результатом аналитико-синтетической переработки одного или нескольких первичных документов, это:
01; вторичный документ
02; электронный документ
03; неопубликованный документ
04; издание
3. Какой документ является непосредственным результатом профессиональной деятельности создателей информации — ученых, специалистов, писателей, журналистов и т.д.?
01; первичный документ
02; опубликованный документ
03; издание
04; вторичный документ
4. Общество, уровень которого в решающей степени определяется количеством и качеством накопленной и используемой информации, ее свободой и доступностью, есть:
01; общество новых информационных технологий
02; информационное общество
03; компьютеризированное общество
04; автоматизированное общество
5. Организованный социально экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей граждан на основе новых информационных технологий, есть:
01; компьютеризация
02; информатизация
03; автоматизация
04; медиатизация
6. Стремительное возрастание общего объема информации, создаваемой в рамках какой-либо отрасли, области деятельности или общества в целом, являющееся следствием научно-технической революции, это:
01; информационный взрыв
02; информационный барьер
05; информационный поток
03; информационный процесс
7. Противоречие между быстро возрастающими объемами и потоками информации, потребностями общества в ее обработке для повышения уровня производства и жизни и ограниченными возможностями человека, это:
01; информационный барьер
02; информационный кризис
03; информационный взрыв
04; информационный процесс
8. Совокупность информационного мировоззрения и системы знаний и умений, обеспечивающих целенаправленную самостоятельную деятельность по оптимальному удовлетворению индивидуальных информационных потребностей с использованием как традиционных, так и новых информационных технологий, есть:
01; библиотечно-библиографическая культура
02; компьютерная грамотность
03; информационная культура
04; информационная грамотность
9. Производством информации обо всех опубликованных в России документах по всем отраслям знаний занимается:
01; Российская государственная библиотека (РГБ)
02; Российская национальная библиотека (РНБ)
03; Государственная публичная научно-техническая библиотека России (ГПНТБ)
04; Российская книжная палата (РКП)
10. Центром производства и распространения информации в области социальных и гуманитарных наук является:
01; Российская книжная палата (РКП)
02; Российская национальная библиотека (РНБ)
03; Научный центр правовой информации (НЦПИ)
04; Институт научной информации по общественным наукам (ИНИОН)
11. Ведущим (головным) учреждением в сфере производства и распространения информации по естественным, точным и техническим наукам является:
01; Российская государственная библиотека (РГБ)
02; Российская книжная палата (РКП)
03; Всероссийский институт научно-технической информации (ВИНИТИ)
04; Государственная публичная научно-техническая библиотека России (ГПНТБ)
12. Специальное буквенное обозначение, характеризующее часть Интернет-адреса и определяющее либо географическое местоположение сервера, либо его принадлежность к тому или иному типу организации, это:
13. Комплекс web-страниц, предназначенных для обмена сообщениями с возможностью их классификации по темам и сохранения их для последующего использования, называется:
14. Совокупность Web-страниц, связанных единством содержания и, как правило, оформления, с возможностью навигации между этими страницами, имеющая общее доменное имя, это:
15. Компьютерная система и технология, обеспечивающая возможность создания, хранения и воспроизведения разнородной информации, включая текст, звук, видеоизображение, это
01; анимация
02; мультимедиа
03; телетекст
04; гипертекст
16. Какой из видов ресурсов обладает свойствами нерасходуемости, неисчерпаемости и постоянного роста объема:
01; стратегические ресурсы
02; кадровые ресурсы
03; информационные ресурсы
04; природные ресурсы
17. Кардинальные изменения в сфере обработки информации, имеющие следствием преобразование общественных отношений и приобретение обществом нового качества, это:
01; информационный кризис
02; информационная революция
03; информационный взрыв
04; информационный процесс
Раздел II. ОСНОВНЫЕ ТИПЫ ИНФОРМАЦИОННО-ПОИСКОВЫХ ЗАДАЧ И АЛГОРИТМЫ ИХ РЕШЕНИЯ
18. Книги о способах защиты от компьютерных вирусов, опубликованные на русском языке за последний год, рациональнее всего найти, используя:
01; Книжную летопись
02; Реферативный журнал «Информатика»
03; Журнал «КОМПЬЮТЕР ПРЕСС»
04; Списки литературы в монографиях по компьютерной безопасности
19. Ответ на вопрос «Что такое Интранет?» можно найти, используя:
01; алфавитный каталог
02; систематический каталог
03; справочные издания
04; библиографический указатель
20. При адресном поиске основным поисковым элементом является:
01; фамилия конкретного автора
02; тема книги
03; год издания
04; жанр книги
21. Библиотечный каталог, в котором библиографические записи располагаются по отраслям знаний в соответствии с определенной системой классификации, это
01; алфавитный каталог
02; систематический каталог
03; предметный каталог
04; электронный каталог
22. Подобрать книги по теме заданного вам реферата можно с помощью:
01; алфавитного каталога
02; систематического каталога
03; систематической картотеки статей
04; картотеки периодических изданий
23. Установить наличие в библиотеке журнала «Мир ПК» можно по:
01; систематическому каталогу
02; алфавитному каталогу
03; картотеке периодических изданий
04; предметному каталогу
24. Установить наличие в библиотеке книги И. Панарина «Технология информационной войны» можно по:
01; систематическому каталогу
02; алфавитному каталогу
03; реферативному журналу «Информатика»
04; предметному каталогу
25. Для получения файла с FTP –сервера необходимо знать:
01; размер файла
02; адрес FTP –сервера
03; E-mail
04; ключевое слово
26. Чтобы сократить избыточную информацию, полученную в результате поиска в Интернете, при работе с поисковой системой необходимо использовать:
01; логические операторы
02; электронный каталог
03; пароль
04; гиперссылки
27. Глобальная вычислительная сеть, объединяющая множество региональных, ведомственных, частных и иных сетей каналами связи и едиными для всех ее участников правилами организации пользования и приема/передачи данных, определяемых протоколом TCP/ IP, это:
01; ИНТРАНЕТ
02; Сотовая сеть
03; ИНТЕРНЕТ
04; ИНТРАСЕТЬ
28. Программа, установленная на компьютер пользователя и предназначенная для просмотра Интернет-ресурсов.
29. Для быстрого нахождения часто используемого Вами регулярно обновляющегося Интернет-ресурса целесообразнее:
01; сохранять web-страницу на своем компьютере
02; фиксировать вручную адреса Web-страниц в записной книжке
03; заносить адрес ресурса в папку «Избранное» («Favorites») на свой компьютер
04; копировать адрес страницы в текстовый файл
30. Какой из пропущенных в данном библиографическом описании элемент прежде всего следует уточнить, чтобы в библиотеке вам могли выдать этот документ: Гендина Н.И. Феномен информации: Грамотность без оттенка примитивности// Учительская газета. — №30 (27 июля).
01; жанр статьи
02; фамилию соавтора
03; год издания
04; номера страниц
РАЗДЕЛ III. АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ПЕРЕРАБОТКА ИСТОЧНИКОВ ИНФОРМАЦИИ
31. Издание, содержащее систематизированные сведения о документах (опубликованных, неопубликованных, непубликуемых), либо результат анализа и обобщения сведений, представленных в первоисточниках, выпускаемое организацией, осуществляющей научно-информационную деятельность, это:
01; информационное издание
02; электронный каталог
03; список литературы
04; библиографический указатель
32. Информационное издание, содержащее в систематизированном виде рефераты документов по какой-либо отрасли, предмету, проблеме, есть:
01; реферативный обзор
02; экспресс-информация
03; сигнальная информация
04; реферативный журнал
33. Совокупность библиографических сведений о цитируемом, рассматриваемом или упоминаемом в тексте документе, необходимых и достаточных для общей характеристики, идентификации и поиска документа, это:
01; примечание
02; сноска
03; библиографическая запись (библиографическое описание?)
04; библиографическая ссылка
34. Слова, несущие в тексте наибольшую смысловую нагрузку, называются:
01; ключевые слова
02; метафоры
03; омонимы
04; синонимы
35. Дословная выдержка из текста какого-либо документа, есть:
36. Научный документ, содержащий основные положения доклада или сообщения, подготовленный для научной конференции, симпозиума, семинара, есть:
01; отчет
02; тезисы
03; диссертация
04; научная статья
37. Совокупность сведений справочного, научного или пояснительного характера, дополняющих основной текст, помогающих лучше понимать его и (или) облегчающих пользование книгой, это:
01; дайджест
02; справочный аппарат книги
03; обзор
04; резюме
38. Вторичный документ, представляющий собой совокупность библиографических сведений о документе, приведенных в строго определенном порядке, позволяющих разыскать, идентифицировать документ и дать его общую характеристику, это:
01; библиографическая запись
02; библиографическая ссылка
03; сноска
04; библиографическое описание документа
39. Преобразование содержания документов с целью их анализа, извлечения необходимых сведений, а также их оценки, сопоставления и обобщения, есть:
01; конвертирование информации
02; форматирование информации
03; индексирование
04; аналитико-синтетическая переработка информации
40. Процесс физического уменьшения объема первичного документа при сохранении его основного смыслового содержания, есть:
01; свертывание информации
02; кодирование информации
03; трансформирование данных
04; конвертирование информации
41. Вторичный документ, содержащий краткую обобщенную характеристику первичного документа с точки зрения его назначения, содержания, вида, формы и отвечающий на вопрос «О чем сообщается в первичном документе?», есть:
01; аннотация
02; дайджест
03; обзор
04; библиографическое описание документа
42. Вторичный документ, представляющий собой краткое точное изложение содержания первичного документа, включающее основные фактические сведения и выводы, и отвечающий на вопрос «Что именно сообщается в первичном документе?», есть:
43. Вторичный документ, в котором в сжатой форме изложено содержание документов, объединенных одним или несколькими общими признаками (тема, автор, хронологический период, язык и т.п.), это:
01; реферат
02; обзор
03; аннотация
04; библиографический указатель
44. Наименование службы и предоставляемой ею услуги по пересылке и получению электронных сообщений по распределенной (в том числе глобальной) компьютерной сети, это:
01; гофер
02; интерфейс
03; электронная почта
04; портал
45. Нелинейная компьютерная форма представления информации, характеризующаяся наличием связей и ссылок между фрагментами текста, есть:
01; гипертекст
02; мультимедиа
03; сайт
04; гипермедиа
46. Сообщения, имеющие рекламный характер, навязанные адресату и не представляющие для него интереса, пересылаемые по электронной почте, это:
РАЗДЕЛ IV. ТЕХНОЛОГИИ ПОДГОТОВКИ И ОФОРМЛЕНИЯ РЕЗУЛЬТАТОВ САМОСТОЯТЕЛЬНОЙ УЧЕБНОЙ И НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫ ВЫПУСКНИКОВ ОБЩЕОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ
47. Систематизированный перечень разделов, подразделов, характеризующий содержание, логику и композицию подготовленного вами сочинения, реферата, доклада и т.п., это:
48. Установите правильную последовательность действий при работе над сочинением:
1- написание черновика сочинения
2- составление плана сочинения
3- подбор фактов, примеров
4- подбор литературы
5- чтение и анализ литературы
6- редактирование
7- оформление сочинения
49. В состав какого документа входят все перечисленные ниже аспекты: тема книги, краткий пересказ сюжета, характеристика главных героев, выделение запомнившихся фрагментов, объяснение, почему понравилась книга, высказывание своего отношения к прочитанному, самостоятельная оценка книги?
01; реферата
02; сочинения
03; отзыва на книгу
04; обзора
50. Установите правильную последовательность действий при работе над отзывом на книгу:
1- подготовка плана отзыва
2- редактирование
3- составление библиографического описания документа
4- написание черновика отзыва
5- оформление отзыва
51. Специфической чертой подготовленного вами конспекта, отличающего его от других результатов свертывания информации, является:
01; индивидуализированный характер представления информации
02; полнота отражения информации
03; лаконичность
04; точность отражения информации
52. Исключите элемент, не входящий в состав тезисов, подготавливаемых на основе первоисточника:
01; библиографическое описание документа
02; основные положения, идеи первоисточника
03; примеры, иллюстрации
04; определения основных понятий, используемых в первоисточнике
53. Исключите свойство, не присущее официально-деловым документам:
01; точность и однозначность
02; эмоциональность, экспрессивность
03; стандартизация речевых оборотов
04; стилистическая нейтральность,
54. Какой из приведенных ниже адресов является адресом электронной почты:
01; http://www.spesialist.ru
02; www.spesialist.ru@петр
03; http://www.spesialist.ru@petr
04; Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
55. Что такое URL?
01; пароль доступа к файлу
02; вид телеконференции
03; электронный адрес документа в среде WWW
04; графический интерфейс для оперативного поиска данных в сети
56. В предложенном списке укажите URL
57. Инструмент для поиска информации в Интернете, использующий специальную программу для сканирования сети, при помощи которого пользователь может получить список ссылок по его запросу, есть
01; электронные каталоги
02; поисковые системы
03; базы данных
04; порталы
58. Инструмент для поиска библиографической информации, позволяющий осуществлять поиск по всем значимым полям с возможностью усечения терминов запроса, есть
01; поисковые системы
02; базы данных
03; электронные каталоги
04; электронные библиотеки
59. Распределенная информационная система, позволяющая надежно сохранять и эффективно использовать разнородные коллекции электронных документов через глобальные сети передачи данных в удобном для конечного пользователя виде.
01; электронная библиотека
02; база данных
03; поисковая система
04; электронная почта
60. Инструмент поиска информации на сайтах, обладающий иерархически упорядоченным набором предметных рубрик и базой данных документов, есть:
01; поисковая машина
02; портал
03; форум
04; поисковый каталог
Ключи к тестовым заданиям
Раздел I. Информационные ресурсы общества и информационная культура
Раздел II. ОСНОВНЫЕ ТИПЫ ИНФОРМАЦИОННО-ПОИСКОВЫХ ЗАДАЧ И АЛГОРИТМЫ ИХ РЕШЕНИЯ
РАЗДЕЛ III. АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ПЕРЕРАБОТКА
ИСТОЧНИКОВ ИНФОРМАЦИИ
РАЗДЕЛ IV. ТЕХНОЛОГИИ ПОДГОТОВКИ И ОФОРМЛЕНИЯ РЕЗУЛЬТАТОВ САМОСТОЯТЕЛЬНОЙ УЧЕБНОЙ И НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫ ВЫПУСКНИКОВ ОБЩЕОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ
- Главная
- Новости
- О НИИ
- История создания
- Общие сведения
- Документы
- Структура
- Фотогалерея
- Участие в конференциях и семинарах
- Обучающие семинары, проведённые сотрудниками НИИ ИТ СС
- Дни программы ЮНЕСКО «Информация для всех» 2008
- Дни программы ЮНЕСКО «Информация для всех» 2010
- Дни программы ЮНЕСКО «Информация для всех» 2011
- Разработки в сфере формирования информационной культуры личности
- Разработки в сфере информационных ресурсов и технологий
- О деятельности НИИ ИТ СС в целом
- В сфере формирования информационной культуры личности
- В сфере сайтостроения
- В сфере интеграции информационной и медиаграмотности
- Скачать
- Международный уровень
- Российский уровень
- Региональный уровень
- Аспиранты, магистранты
- Студенты
- Дипломы и медали
- Благодарственные письма
- Рецензии на работы сотрудников НИИ ИТ СС
- В сфере формирования информационной культуры личности
- В сфере сайтостроения
НИИ ИТ СС — структурное подразделение КемГИК — 2000-2024 гг.
Россия, 650029, Кемерово, ул. Ворошилова, 17
Тел.: (3842) 35-96-15
E-mail: nii@kemguki.ru