Russian Boston Home
Руссике артисты на Американской сцене
SpyLOG   Новости    События    Yellow Pages    Объявления    TV/Video    Форум    Чат    Dating    Фотки 
 News Central
В мире
  Политика
  Разное
Бизнес
  Деньги
Общество
  Мода
  Религия
  Светская жизнь
  Шоу Бизнес
  Пикантные новости
  Животные
  Криминал
Спорт
Искусство
  Кино
  Музыка
Авто
Hi-Tech
  Интернет
  Hardware
  SoftNews
Здоровье
Путешествия
Вокруг света
USA
Россия
  
Ресурсы
  Самые последние
  Самые читаемые
Архив
 Другие ресурсы
Все Ресурсы

Рассылки
Газеты
Журналы
ТВ - Online
Радио

Юмор
  Анекдоты
  Игры
  Этикетки
  
Открытки
  Поздравь друга
  
Программа TV
Кино
  Новости кино
  Кинообзоры
  
Музыка
  Радио в internet
  Russian Top
  
Спорт
Web Обзоры Exler.ru
  
Читальный зал
ЭКСпромт - статьи для чайников
Компьютерные игры
Finance News
Автообзоры
Russian America Journal Digest
 Смотрите также
Yellow Pages
Объявления
Чат
Форум
  последнее

Читальный зал
  Стихи
  Проза
  Кулинария

Едем в Америку!
  Иммиграция
  Визы
  Советы

Знакомства
Фотоальбомы
Top Rating
  America TOP
  
 
NEWS CENTRAL >> Hi-Tech >> Интернет

Интернет

Алгоритм поиска "горячих" тем в интернете
7:29PM Thursday, Mar 6, 2003
Компьюлента. 4 марта 2003 года, 11:15

Американский ученый Джон Клайнберг из Корнелльского университета предложил новый способ фильтрации информации, позволяющий выявлять наиболее актуальные для каждого конкретного момента времени проблемы и темы для обсуждений. Способ, предложенный Клайнбергом, основывается на анализе больших объемов текстовой информации с целью выявления наиболее часто встречающихся слов. Когда происходит какое-либо важное событие, о нем начинают говорить и писать очень многие. Это приводит к своеобразным "скачкам" в частоте употреблении тех или иных слов.

Взяв за основу эту идею, Клайнберг разработал алгоритм, позволяющий анализировать частоту использования того или иного слова. На выходе алгоритм представляет собой рейтинг слов, на основании которого можно делать выводы о популярности той или иной темы и производить сортировку информации.

Само собой, что из рейтинга должны исключаться служебные части речи: артикли, предлоги, союзы, а также наиболее распространенные местоимения, числительные и слова общеупотребительной базовой лексики, например, "время", "больше", "меньше" и т.д. Ведь именно эти слова встречаются чаще всего, однако установить по частоте их упоминания какие-либо тенденции вряд ли возможно. Например, в рейтинге слов Usenet первое место занимает определенный артикль "the", второе - предлог "to", а третье - предлог "of". В первой десятке также находятся неопределенный артикль "a", союз "and", глагол "is" и местоимение "i". Сделать на основании вершины этого рейтинга какой-либо анализ едва ли получится.

Система Клайнберга, однако, работает гораздо эффективнее. Чтобы испытать свою разработку, он заставил ее проанализировать тексты всех президентских докладов о положении в США (State of the Union addresses), начиная с 1790 г. В итоге получилось, что в период Войны за независимость американских колоний часто употреблялись слова militia ("ополчение") и British ("британский"). А в период с 1947 по 1959 годы наблюдался "скачок" в использовании слова atomic ("атомный"). Таким образом, удалось доказать работоспособность системы.

Использовать разработку Клайнберга можно в самых разных областях. Сам ученый собирался создать на ее основе утилиту для фильтрации электронной почты, которая на основе частоты упоминания слов определяла бы важность писем. Важным проблемам могут быть посвящены письма многих людей, которые будут использовать одни и те же слова. Это позволит отделить "зерна от плевел". Помимо этого, технологию можно будет использовать для повышения релевантности поиска в интернете, а также для выявления наиболее "горячих" новостей и дискуссионных тем.

Например, создав рейтинг слов, употребляемых в блогах - онлайновых дневниках, получивших за последний год бешеную популярность, можно определить, о чем предпочитают говорить пользователи интернета. Такая информация может представлять интерес для журналистов, ищущих темы для своих репортажей, маркетологов, которые смогут эффективнее выявлять предпочтения пользователей и корректировать соответствующим образом рекламные кампании. Наконец, рейтинги слов в блогах окажут помощь и государству, которое сможет следить за умонастроениями граждан. Последнее, впрочем, относится лишь к странам, где интернетом пользуется более половины населения, в противном случае, выборка для анализа получится непредставительная. Рейтинг упоминаемости слов в блогах уже существует и располагается на сайте Daypop.

« « Вернуться       Далее » »
Другие новости по теме
  • Google создает рекламную службу в интернете
  • Новый опасный вирус Lovegate угрожает пользователям Windows
  • Февральский взлом хакеров оказался крупнейшим в истории
  • Как глупая шутка превратилась в популярный сайт
  • Microsoft выходит на рынок с принципиально новым продуктом

    Далее » »   Digest | Архив »    
Смотрите также: Hi-Tech, Hardware, SoftNews
 
Читайте также:

Disney договорился с Google и продал InfoSeek

Новая дыра в популярном почтовом сервере Sendmail

Сайт RIAA администрирует ветеран американской армии

Обнаружен новый сетевой червь Randon

Несколько десятков иранцев арестованы за посещение сайта знакомств

Троян, ворующий деньги, маскируется под открытку


Британские бюрократы избегают интернета

Казахскому хакеру, взломавшему сервер агентства Bloomberg, дали 20 лет

Закрылся журнал Red Herring

Появилась версия сайта Afisha.ru для Санкт-Петербурга

Брешь в Windows Mе позволяет хакеру открывать файлы на чужом компьютере

"Мосэнерго" экспериментирует с передачей данных по электросети.

Пользователей AOL подключат к платной музыкальной службе MusicNet

Amazon запатентовал веб-форумы

Главный соперник Google приобретён компанией Overture

Поисковые системы

Виртуальный марш протеста парализовал коммуникации Белого дома

Серьезные проблемы с контакт-листами ICQ

Sony PlayStation подключат к игровой суперсети Butterfly.net

Интерфейс браузеров можно усовершенствовать

Microsoft открыла портал, облегчающий миграцию на Office XP и Windows XP



Рассылки:
  Новости-почтой
  TV-Программа
  Гороскопы
  Job Offers
  Концерты
  Coupons
  Discounts
  Иммиграция
  Business News
  Анекдоты
Многое другое...

News Central Home | News Central Resources | Portal News Resources | Help | Login
  Рейтинг@Mail.ru Russian America Top © 2025 RussianAMERICA Holding
All Rights Reserved • Contact