1. Поиск ключевых слов в тексте вопроса
Во многих вопросах есть так называемые «ключевые слова» (другие названия — «флажки», «маячки»), т.е. подсказки, специально вставленные автором, чтобы помочь игрокам выйти на правильную версию. Иногда они сразу бросаются в глаза, поскольку выбиваются из текста вопроса. Тогда остается лишь понять, в какой именно направлении хотел с помощью этой подсказки направить творческую мысль игроков автор. Бывает и иначе — ключевые слова могут быть тщательно замаскированы. В этом случае необходим вдумчивый и аккуратный анализ текста вопроса с целью их выявления.
Вопрос. Есть версия, что по первоначальному замыслу этот человек должен был носить имя Сава. Однако он так и остался безымянным, да и знаем мы об обстоятельствах его жизни и смерти совсем немного. А вот об одном его родственнике познания у нас, можно сказать, энциклопедические. Назовите этого родственника.
В
этом вопросе ключевое слово опознается
сразу, на него невозможно не обратить
внимание.
Ответ: Евгений Онегин. Савой Пушкин собирался назвать его дядю, со смерти которого начинается действие романа, но потом передумал, и в тексте дядя остался безымянным.
Это был очень простой вопрос, для опытной команды не составляющий никакого труда. А вот пример посложнее.
Вопрос. В 1833 г. Карл Брюллов закончил знаменитую картину «Последний день Помпеи». Она произвела фурор сначала в Италии, где и была написана, а потом во Франции. Ее слава достигла России гораздо раньше самой картины. Сегодня «Последний день Помпеи» находится в Государственном Русском музее, а вот первая из ее многочисленных копий — в музее Пушкина на Старом Арбате. В чем уникальность этой копии?
Тут
трудно вычленить одно конкретное
ключевое слово. Но подсказка в вопросе
явно есть. Проанализируем текст, исходя
из того, что ничего лишнего в нем быть
не должно. Становится понятно, что автор
слишком подробно рассказывает историю
путешествия картины из Италии в Россию,
подчеркивая продолжительность этого
путешествия. А из третьего предложения
следует, что отечественные любители
искусства хотели увидеть нашумевшую
картину как можно скорее… Осталось
осознать, что речь идет именно о первой
копии — и ответ готов.
Ответ: ее автор не видел самой картины, копия выполнена со слов очевидцев.
Как
видно из второго примера, этот технический
прием используется отнюдь не только в
тех случаях, когда задуманная автором
подсказка сводится к единственному
ключевому слову. Надо помнить, что вопрос
(по крайней мере, вопрос квалифицированного
автора) — это маленькое литературное
произведение, поэтому все, что кажется
в нем лишним, неестественным, чрезмерно
акцентированным, может быть намеком,
ведущим к решению. Анализ текста вопроса
— основа игры.
понятие, как подобрать и вставить в текст студенческой/научной работы, роль? *
Независимо от того какой вид исследования или письменный материал готовит автор (будь то студент, копирайтер или исследователь), чтобы в перспективе было легче найти и понять суть работы, следует грамотно расставить ключевые слова.
Что это такое?
Ключевые слова – это те термины и обороты, которые подчеркивают суть исследования и преобладают в речевом обороте автора. Эти словесные единицы призваны облегчить понимание и поиск информации по теме НИР.
Большинство студентов полагает, что ключевые слова используются только в научных работах – статьях, аннотациях, монографиях, диссертациях. Но на самом деле и действие гораздо шире: от банального реферата, доклада до курсовой и дипломной работы.
Способы подбора и ввода ключевых слов в текстКлючевое слово может быть представлено в виде отдельного термина, а также в форме словосочетаний. Как правило, в одно работе выделяют до 5-15 «ключей» притом располагаться они должны равномерно по всему тексту. Вписывать данные единицы можно «на ходу», то есть изначально формируя рукопись, ли по мере вычитки и редактирования текста.
Строгих ограничений в части употребления ключевых слов в студенческих и научно-исследовательских работах нет. Главное – грамотно, корректно и в разумном количестве употреблять их в проекте, не громоздя и не усложняя восприятие информации. Оптимальным вариантом считается включение в большие исследования до 7-10 «ключей», в курсовые проекты и рефераты – до 5-7, в научные статьи – до 2-5.
Оформление ключевых слов должно соответствовать требованиям исследования, ГОСТам и пр.
Как подобрать ключевые слова при выполнении курсовых работ, НИР и прочих студенческих изысканий, НИР?
Автор реферата, доклада или курсовой работы не задумывается о необходимости выделения ключевых слов. В целом, ему просто нет до этого дела, так как основная цель исследователя в данном случае – максимально полно раскрыть выбранную тему, подобрать подходящие источники информации и обработать их, сформировать выводы и пр. Поэтому включение ключевых слов в студенческую работу происходит на этапе вычитки материала, проверки текста на ошибки, нормоконтроль и прочие нюансы. Фактически включение «ключей» в текст исследования происходит после формирования чернового варианта, параллельно внесению правок и исправлению замечаний.
Миссия ключевых слов – облегчить поиск информации и понять буквально из «нескольких слов» суть исследования: о чем оно, какая проблема исследуется и для чего.
На что ориентироваться при подборе ключевых слов?Исходя из указанной миссии, можно сделать следующий вывод по подбору ключевых слов:
- Основной ориентир – тема. Как правило в заголовке уже сидит 1-2 ключевых слова. Из темы выделяем проблему исследования – это уже первый «ключ», второй – тесно связанный с темой или основным термином – его синоним или расшифровка и т.д.;
- Второстепенный ориентир – план проекта, заголовки глав и разделов. Из указанных наименований также легко конкретизировать, что будет описываться, для чего, а затем кратко и емко описать это в 12- словах;
- Анализируем основную часть проекта, внимательно перечитывая текст.
- Выделяем из текста слова с высокой смысловой нагрузкой и оцениваем роль каждого из них в исследовании. Если они способствуют раскрытию темы и основного замысла, то их можно причислить к «лику ключевых».
Опытные авторы и исполнители по выделению студенческих и научно-исследовательских работ рекомендуют придерживаться следующих правил по выделению и «обрамлению» ключевых слов:
Правило №1. Думайте, как простой читатель (притом лучше всего без квалификации и глубоких познаний по теме). Кто чаще всего пользуется учебными и научными материалами? Конечно же, студенты, учащиеся, молодые или начинающие, а также «продвинутые» исследователи в целях погружения в конкретную тему, повышения квалификации/аттестации и пр.
Правило №2. Не ограничивайтесь одним словом или узкоспециализированным термином, используйте словосочетания. Более трети начинающих авторов и исследователей, студентов полагает, что ключевое слово должно быть представлено в виде 1 словесной единицы, но на самом деле это может быть целый оборот (из 2-3 слов). Отдельные слова могут быть либо слишком общими (не отражать основную идею), либо слишком узкими, сложно воспринимаемыми. Поэтому важно грамотно переложить «сложное в простое». Лучше всего ориентироваться на запросы в поисковиках (как искомая тема вбивается пользователями).
Правило №3. Отсекаем лишнее. При формировании «ключей» важно найти «золотую середину», которая способствовала бы быстрому и эффективному поиску информации. Поэтому рекомендуется «активировать» ключевые механизмы, включающие до 3 слов. Краткость – сестра таланта, способствующая упрощению данных. Например, «уничтожение пищевых отходов с помощью специальной переработки» можно представить в виде ключа «переработка пищевых отходов».
Правило №4. Не боимся использовать сокращения и аббревиатуры. Данная концепция действует лишь в случае уместного употребления наиболее распространенных и всем известных сокращений слов (например, организации, форма собственности и пр.): ИП, ЧУП, ОГРН, ДОУ и пр. Но здесь также важно учесть смысловую. Нагрузку сокращения: не имеет ли она двоякой трактовки, уместна ли контексте и пр.
Правило №5. Используем различные варианты «вхождения ключей». В классической форме принято выделять ключевые слова в именительном падеже и единственном числе. Данный формат используется при формировании аннотаций или отдельного подпункта «ключевые слова» в научных статьях. В студенческих и научно-исследовательских работах применимо три варианта «вписывания» ключевых слов: точное вхождение – употребление в неизменном изначальном виде, неточное – незначительное изменение формы слова, но со строгим сохранением смысловой нагрузки, разбавленное вхождение – когда основной «ключ» становится более объемным из-за использования вспомогательных слов. Выбор варианта задействования «ключей» целесообразно основывать на таких принципах, как суть (тема), удобочитаемость, целенаправленность.
Правило №6. Уместность ключевых слов. Здесь важно учитывать не только тематику исследования, но и стиль изложения информации с акцентом на индивидуальность автора, структуру и содержание проекта, смысловую нагрузку (простота изложения) и пр.
Правило №7. Рациональность и частота употребления. Не стоит громоздить «ключи» в каждом втором абзаце. Важно равномерно их вписать по всему проекту, чтобы избежать речевых, логических, грамматических и иных ошибок. Ключевые слова вовсе не обязаны бросаться и врезаться в глаза читателя, но при этом должны быть запоминающимися и важными.
Правило №8 Доверяй, но проверяй. Чтобы убедиться, что вписанные ключевые слова и обороты эффективно работают, попробуйте просто вбить их в поисковик. Если на запросы выходит полезная информация, соответствующая теме, то Вы все сделали правильно.
Правило №9. Подключает современные средства по подбору ключевых слов. В настоящее время не обязательно самостоятельно «изобретать велосипед», можно в значительной степени облегчить задачу, задействовав онлайн-сервисы по генерированию ключевых слов (например, Google, Keyword Tool), но учтите, что «автоматизированные системы» полагаются только на частоту запросов, не учитывая замысел, идею автора и его изыскания. Поэтому после получения «выборки», важно обработать ее и корректно употребить в работе.
Порядок оформления ключевых слов в студенческих и научно-исследовательских работах
Оформление «ключей» в тексте курсовых, дипломных и научных работ занимает отдельное место в нашей статье неспроста.
Давайте вспомним и проанализируем, как часто мы сталкивается с «ключами» при выполнении курсовых и дипломных работ? Студент фактически о них не задумывается, а в методических рекомендациях и вовсе нет такого пункта, как «оформление ключевых слов». Отсюда следует, что в основной части исследования ключи не будут выделяться из общего контекста зрительно, а оформление будет соответствовать общим правилам и не более того.
Самые лояльные критерии оформления действуют в отношении простейших студенческих работ – рефераты и доклады. В данном случае возможно пометить их в основной части проекта «ключи» жирным шрифтом или курсивом.
Оформление ключевых слов в научных работахПри написании научных работ и статей отношение к данной категории кардинально меняется. Здесь исследователи просто обязаны вынести «ключи» в точном вхождении в отдельном разделе. В частности, научная статья оформляется следующим образом: заголовок, аннотация, ключевые слова. Здесь рассматриваемая нами «алгоритмика» выносится в отдельный и емкий подпункт, где через запятую будут перечислены важные термины и обороты, подчеркивающие суть изыскания. Аналогичная тенденция прослеживается в отношении монографий, диссертаций и пр.
В научных проектах ключевые слова выносятся отдельно (под аннотацию) и выделяются курсивом.
Таким образом, ключевые слова в студенческих проектах играют важную, но малозаметную роль. От грамотности и навыков автора в части выделения и расстановки «ключей» зависит дальнейшая судьба проекта: просматриваемость текста, цитируемость материалов, качество исследования в целом.
Специалисты DissHelp умело сгенерируют и расставят «ключевые слова» и вхождения к любой студенческой и научно-исследовательской работе, способствуя эффективному использованию «новоиспеченных» проектов в перспективе и их быстрому поиску.
Свободный поиск по тексту или ключевому слову — комплексный поиск в социальных науках
Булевы операторы используются для соединения и определения отношений между условиями поиска. При поиске в электронных базах данных вы можете использовать логические операторы, чтобы расширить или сузить результаты поиска. Три логических оператора: И , ИЛИ и НЕ .
Булевы операторы
Булевы операторы — это простые слова (И, ИЛИ и НЕ), используемые в качестве союзов для объединения или исключения ключевых слов в поиске, что приводит к более целенаправленным результатам поиска.
ИЛИ
- Расширяет поиск
- Используется для получения похожих терминов или синонимов
- Находит все элементы с либо подростка ИЛИ подростка
- В теории множеств и математике « объединение » включает «ИЛИ».
«ИЛИ» = подросток
И
- Сужает или ограничивает область поиска
- Используется для получения несвязанных терминов
- Находит элементы с и диета и дети
- В теории множеств и математике « пересечение » равно «И».
«И» = диета ∩ дети
НЕ
- Сужает или ограничивает область поиска
- Находит термин «паук», а не «обезьяна»
- Используйте оператор НЕ с осторожностью
- Может удалить соответствующие записи
Примечание.
И является оператором по умолчанию или подразумеваемым в Usearch, Google, Scopus, PubMed, EBSCOhost и большинстве поисковых интерфейсов.
«экотуризм устойчивый» совпадает с «экотуризм И устойчивый»
В Usearch, EBSCOhost, SCOPUS и PubMed логические операторы (И, ИЛИ, НЕ) необходимо вводить заглавными буквами .
Поиск по фразе
Поиск по фразе осуществляется по цитатам.
Например:
«международный олимпийский комитет»
«Юта теннис»
Он находит точную фразу и элементы со словами в порядке ввода. Единственным исключением является Scopus. Scopus использует фигурные скобки или фигурные скобки для поиска по {точной фразе}. В Scopus кавычки используются для поиска по «расплывчатой/приблизительной фразе».
Усечение корней
Усечение или выделение корней осуществляется с помощью звездочки *. Он также известен как подстановочный знак. Усечение — это символ, который извлекает все суффиксы или окончания слова.
Например:
school* получает информацию о школе, школах, школьном обучении, обучении и т. д. , % (знак процента) — это односимвольный подстановочный знак, а ? (вопросительный знак) — это усечение нескольких символов.
Вложение
Вложение обычно используется при объединении более чем одного логического оператора (ИЛИ, И). Большинство поисковых интерфейсов выполняют поиск слева направо. Использование скобок в поиске изменяет порядок операций.
Например:
(мораль* ИЛИ этика*) И (помощь в самоубийстве ИЛИ эвтаназия)
(лыжи ИЛИ лыжи ИЛИ катание на лыжах ИЛИ сноуборд*) И видео*
Близость или соседство вам найти одно слово на определенном расстоянии от другого.
With (w), Near (n), Next (n) или Pre (p) — распространенные операторы близости.
Примечание:
Прочтите справку по базе данных, чтобы узнать, можно ли использовать операторы близости в ваших поисках.
Спасибо Альфреду Моудуду за авторство этих инструкций.
р — Поиск ключевых слов в тексте и добавление ключевых слов в тему
Задавать вопрос
спросил
Изменено 3 года, 6 месяцев назад
Просмотрено 175 раз
У меня есть большой текстовый фрейм данных, в котором я хочу найти ключевые слова. К ключевым словам также применяются категории. Мне нужна помощь, чтобы выяснить, как добавить 2 столбца, 1 с найденными ключевыми словами и 1 с соответствующими категориями
Я думаю, что у меня есть правильный код для создания столбца ключевых слов; однако я не могу понять, как также создать столбец категории.
#Создать образец данных text <- tibble(phrases = c("Привет, меня зовут Боб", "Я зря потратил время, когда был в этом возрасте", "Во сколько вечеринка?")) keys <- tibble(words = c("имя","возраст","время"),categories = c("демографический","демографический","подробности")) #Найти совпадения ключевых слов text_match <- sapply(paste0(keys$words), grepl, text$phrases) %>% as_tibble() %>% mutate(Ключевые слова = применить(., 1, функция(х) вставить(имена столбцов(.)[х == 1], свернуть = " | ")))
Это правильно генерирует столбец ключевых слов:
name age time Ключевые слова 1 ИСТИНА ЛОЖЬ ЛОЖЬ имя 2 НЕВЕРНО ВЕРНО ВЕРНО возраст | время 3 ЛОЖЬ ЛОЖЬ ИСТИНА время
Но как мне создать столбец категории. Я хотел бы что-то вроде этого:
имя возраст время Ключевые слова Категория 1 ИСТИНА ЛОЖЬ ЛОЖЬ имя демографический 2 НЕВЕРНО ВЕРНО ВЕРНО возраст | время демографическое | подробности 3 FALSE FALSE TRUE детали времени
- r
- текст
- слияние
Если вы хотите использовать tidytext
, а также tidyr
, вы можете получить точный результат. Но в зависимости от того, сколько у вас ключевых слов, вы можете остановиться на шаге 1 ниже.
Сначала я добавляю идентификатор к текстовой таблице. Затем вложите эти данные в df1 с помощью unnest_tokens
. Объедините эти данные с ключевыми словами на шаге 0. На шаге 1 сверните ключевые слова и категории для каждого идентификатора. На шаге 2 добавьте столбец TRUE для каждого найденного ключевого слова на шаге 0, распространите эти данные и объедините их с результатом шага 1, чтобы получить требуемый результат.
библиотека (аккуратный текст) библиотека (тидыр) текст <- текст %>% мутировать (id = row_number()) df1 <- unnest_tokens(текст, "слова", ввод = фразы) step0 <- df1 %>% inner_join(keys) # Соединение, by = "words" шаг1 <- шаг0 %>% group_by(идентификатор) %>% суммировать (Ключевые слова = вставить (слова, свернуть = " | "), Категория = вставить (категории, свернуть = "|")) шаг 1 # Таблетка: 3 x 3 Ключевые слова ID Категория <число> <хр> <хр> 1 1 имя демографический 2 2 раза | детали возраста | демографический 3 3 время подробности шаг2 <- шаг0 %>% мутировать (значение = ИСТИНА) %>% выберите (идентификатор, слова, значение) %>% распространение (слова, значение = значение, заполнение = ЛОЖЬ) %>% внутреннее_соединение (шаг 1) # Присоединение по = "id" шаг 2 # Таблетка: 3 x 6 id возраст имя время Ключевые слова Категория1 1 FALSE TRUE FALSE имя демографический 2 2 ИСТИНА ЛОЖЬ ИСТИНА время | детали возраста | демографический 3 3 FALSE FALSE TRUE детали времени
1
Вы можете использовать case_when из dplyr, если ваш список ключевых слов не очень велик.