filmov
tv
1.3 Практикуем МОЩНЕЙШИЕ методы точного поиска информации через поисковики. НЕинститут Ingello
Показать описание
!!! После заполнение высветится ссылка на чат !!!
МЕТОДЫ ПОИСКА ИНФОРМАЦИИ
Метод 1. Поиск по структуре гиперссылок (ручной поиск)
Такой метод актуален сегодня только в рамках сложных исследований.
Заходим в точку старта - например в википедию.
Ходим по ссылкам.
В итоге переходим на источники информации (обычно статьи),
Потом на их первоисточники.
Потом на какие-нибудь книги.
Или контакты специалистов.
Часто цепочка может оборваться слишком рано, особенно если начинать с
новостных источников
публикаций в соцсетях
неизвестных блогов.
Метод 2. Использование поисковой системы.
Гугл
PageRank - метрика ранжирования по ссылочной массе
Пузырь фильтров - персональные “невидимые” фильтры для запросов - запоминание предпочтений пользователя.
Rank Brain - сложный интеллектуальный алгоритм
Более 200 различных факторов
Анализ смысла, а не буквальности
Распознавание по сленгу, синонимам и понятиям
Зависимость от локациям
Ориентация по предыдущим запросам
DDG (Дак-дак го)
Нет пузыря фильтров - нет информационной ловушки
Агрегирует информацию с других баз данных - Википедия, Bing, Yahoo!, Яндекс и Yummly…
Конфиденциальность пользовательской информации
Поиск по тёмному интернету - даркнету
Важные особенности
Использует данные яндекса (плюс для поиска на русском)
Яндекс обвиняется в слитии данных пользователей властям
Яндекс блокирует информацию о Навальном и войне России в Украине
Дак Дак Го понизил рейтинг сайтов, связанных с рос пропагандой
Метод 3. Использование автоматизированных средств
Программы веб спайдеры (поискойвой бот, краулер)
Создание своей мини-поисковой сети
В основном используется для оптимизации сайтов
Полезен в поиске, т.к. не все сайты индексируются и правильно ранжируются
Особо полезен при знаниях программирования и синтаксического анализа
Способ поиска:
Набор базы ссылок по ключевым словам
Опциональный ручной анализ результатов
Проработка минус-слов
Парсинг контента по ключевым словам и фразам
Ручной анализ результатов
Продвинутая работа с поисковиком на примере Google
От простого к сложному
Сначала самые простые запросы,
Потом низкочастотный (многословные)
Используй подсказки при вводе поисковых фраз
Представляй, как используются слова на сайте
Не правильно: у меня не работает компьютер почему то
Правильно: поломка компьютера черный экран
Низкочастотно: windows 10 черный экран после загрузки
Операторы точного поиска
language - поиск по языкам
location - поиск по локации
inurl - поиск по адресам
intitle - поиск в заголовках
allintitle - все слова в заголовке
intext - поиск в содержании текста
allintext - в тексте должны быть ВСЕ слова
site - поиск в рамках сайта (на его страницах)
related - связанные сайты
link - поиск на странице
inanchor - поиск внутри текста ссылок
cache - поиск старых и удалённых страниц в архиве
filetype - типы файлов (полезно например искать ПДФ файлы)
define - определения
source: - поиск по новостям
map: - карты
stocks: - информация с бирж (торги)
картошка AROUND(3) овощ - слова на расстоянии слов
100..200 - диапазон чисел
2005..2007 - поиск в диапазоне дат
$50..$200 диапазон цен
site: before: - сайты до указанной даты
“in” или “to”, “из” или “в” - перевод из одного формата в другой. Например из доллара в евро. Из мегабайт в гигабайты. 100 мегабайт в килобайт.
“ “ - точное совпадение
OR “|” - поиск одной ИЛИ другой фразы
AND - поиск одной И другой фразы
“*” - любая фраза вместо звёздочки
“@” - поиск по именам пользователей
“#” - поиск по хештегам
“$” - поиск по ценам
“~” - слова синонимы
“-” - не учитывать эти слова
МЕТОДЫ ПОИСКА ИНФОРМАЦИИ
Метод 1. Поиск по структуре гиперссылок (ручной поиск)
Такой метод актуален сегодня только в рамках сложных исследований.
Заходим в точку старта - например в википедию.
Ходим по ссылкам.
В итоге переходим на источники информации (обычно статьи),
Потом на их первоисточники.
Потом на какие-нибудь книги.
Или контакты специалистов.
Часто цепочка может оборваться слишком рано, особенно если начинать с
новостных источников
публикаций в соцсетях
неизвестных блогов.
Метод 2. Использование поисковой системы.
Гугл
PageRank - метрика ранжирования по ссылочной массе
Пузырь фильтров - персональные “невидимые” фильтры для запросов - запоминание предпочтений пользователя.
Rank Brain - сложный интеллектуальный алгоритм
Более 200 различных факторов
Анализ смысла, а не буквальности
Распознавание по сленгу, синонимам и понятиям
Зависимость от локациям
Ориентация по предыдущим запросам
DDG (Дак-дак го)
Нет пузыря фильтров - нет информационной ловушки
Агрегирует информацию с других баз данных - Википедия, Bing, Yahoo!, Яндекс и Yummly…
Конфиденциальность пользовательской информации
Поиск по тёмному интернету - даркнету
Важные особенности
Использует данные яндекса (плюс для поиска на русском)
Яндекс обвиняется в слитии данных пользователей властям
Яндекс блокирует информацию о Навальном и войне России в Украине
Дак Дак Го понизил рейтинг сайтов, связанных с рос пропагандой
Метод 3. Использование автоматизированных средств
Программы веб спайдеры (поискойвой бот, краулер)
Создание своей мини-поисковой сети
В основном используется для оптимизации сайтов
Полезен в поиске, т.к. не все сайты индексируются и правильно ранжируются
Особо полезен при знаниях программирования и синтаксического анализа
Способ поиска:
Набор базы ссылок по ключевым словам
Опциональный ручной анализ результатов
Проработка минус-слов
Парсинг контента по ключевым словам и фразам
Ручной анализ результатов
Продвинутая работа с поисковиком на примере Google
От простого к сложному
Сначала самые простые запросы,
Потом низкочастотный (многословные)
Используй подсказки при вводе поисковых фраз
Представляй, как используются слова на сайте
Не правильно: у меня не работает компьютер почему то
Правильно: поломка компьютера черный экран
Низкочастотно: windows 10 черный экран после загрузки
Операторы точного поиска
language - поиск по языкам
location - поиск по локации
inurl - поиск по адресам
intitle - поиск в заголовках
allintitle - все слова в заголовке
intext - поиск в содержании текста
allintext - в тексте должны быть ВСЕ слова
site - поиск в рамках сайта (на его страницах)
related - связанные сайты
link - поиск на странице
inanchor - поиск внутри текста ссылок
cache - поиск старых и удалённых страниц в архиве
filetype - типы файлов (полезно например искать ПДФ файлы)
define - определения
source: - поиск по новостям
map: - карты
stocks: - информация с бирж (торги)
картошка AROUND(3) овощ - слова на расстоянии слов
100..200 - диапазон чисел
2005..2007 - поиск в диапазоне дат
$50..$200 диапазон цен
site: before: - сайты до указанной даты
“in” или “to”, “из” или “в” - перевод из одного формата в другой. Например из доллара в евро. Из мегабайт в гигабайты. 100 мегабайт в килобайт.
“ “ - точное совпадение
OR “|” - поиск одной ИЛИ другой фразы
AND - поиск одной И другой фразы
“*” - любая фраза вместо звёздочки
“@” - поиск по именам пользователей
“#” - поиск по хештегам
“$” - поиск по ценам
“~” - слова синонимы
“-” - не учитывать эти слова
Комментарии