ru
Классен М. .,Рассел М. .

Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub

Obavesti me kada knjiga bude dodata
Da biste čitali ovu knjigu otpremite EPUB ili FB2 datoteku na Bookmate. Kako da otpremim knjigu?
В недрах популярных социальных сетей — Twitter, Facebook, LinkedIn и Instagram — скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter. Прочитайте эту книгу, чтобы • Узнать о современном ландшафте социальных сетей • Научиться использовать Docker, чтобы легко оперировать кодами, приведенными в книге; • Узнать, как адаптировать и поставлять код в открытый репозиторий GitHub; • Научиться анализировать собираемые данные с использованием возможностей Python 3; • Освоить продвинутые приемы анализа, такие как TFIDF, косинусное сходство, анализ словосочетаний, определение клика и распознавание образов; • Узнать, как создавать красивые визуализации данных с помощью Python и JavaScript. Мэтью Рассел (Matthew Russell) — директор Built Technologies, он возглавляет команду лидеров, работающую над улучшением нашего мира. Вне работы Мэтью рациональный индивидуалист, готовящийся к возможному зомби-апокалипсису. Михаил Классен (Mikhail Klassen) — главный специалист по обработке и анализу данных в Paladin AI, стартапе, занимающемуся адаптивными технологиями обучения. Он увлекается проблемами искусственного интеллекта и анализом данных. Когда Михаил не занят на работе, он любит читать и путешествовать.
Ova knjiga je trenutno nedostupna
694 štampane stranice
Da li već pročitali? Kakvo je vaše mišljenje?
👍👎

Citati

  • Jen Schwarzje citiralaпре 5 година
    Библиотека pandas для Python — важный инструмент в арсенале любого исследователя данных, и мы будем использовать ее далее в этой книге. Она предлагает высокопроизводительные структуры данных для хранения табличных данных и мощные средства анализа, написанные на Python, при этом некоторые части библиотеки, выполняющие особенно интенсивные вычисления, написаны на C или Cython. Разработка библиотеки была начата в 2008 году Уэсом Маккинни (Wes McKinney), и первоначально она предназначалась для анализа финансовых данных.
  • Jen Schwarzje citiralaпре 5 година
    Существует совершенно отдельный вид анализа, известный как разрешение сущностей (или устранение неоднозначности сущностей, в зависимости от формулировки задачи), помогающий объединить упоминания предметов в одно номинальное понятие. Например, в данном случае процесс разрешения сущностей мог бы заметить, что в Open Graph имеется несколько узлов, в действительности ссылающихся на одно и то же номинальное понятие Mining the Social Web, и создать связи между ними, указав, что в действительности они представляют одну и ту же сущность в реальном мире

Na policama za knjige

fb2epub
Prevucite i otpustite datoteke (ne više od 5 odjednom)