КаталогКниг.РФ

Сбор данных в Интернете на языке R (Храмов Дмитрий Александрович) ; ДМК-Пресс, 2017

Книга: Сбор данных в Интернете на языке R (Храмов Дмитрий Александрович) ; ДМК-Пресс, 2017

от 415 р. до 1989 р.


Сравнить цены

Цена от 415 р. до 1989 р. в 9 магазинах

МагазинЦенаНаличие
Лабиринт

5/5

1443 р. 2062 р.
Буквоед

5/5

1989 р.
Минимальная сумма заказа 100 рублей
ЛитРес

5/5

415 р. 519 р.
электронная книга | скачать фрагмент
Book24

5/5

1989 р.
Яндекс.Маркет

5/5

1356 р.
МАЙШОП

5/5

1252 р. 1925 р.
Читай-город

5/5

1499 р.
наличие уточняйте
02.12.2023
Мегамаркет

5/5

1415 р. 2359 р.
наличие уточняйте
13.04.2024
OZON
913 р.
наличие уточняйте
03.01.2024
AliExpress

5/5

Как купить или где мы находимся +

Описание

Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.

Смотри также Характеристики.

Яндекс.Маркет


Содержание

Введение
ЧАСТЬ I. ПРОГРАММИРОВАНИЕ НА R
Глава 1. Знакомство с R
Глава 2. Скаляры, векторы и матрицы
Глава 3. Списки и таблицы
Глава 4. Управление процессом вычислений
Глава 5. Базовая графика
Глава 6. Функции
Глава 7. Факторы и даты
Глава 8. Пакеты
Глава 9. Ввод и вывод данных. Работа с файлами
ЧАСТЬ II. СБОР ДАННЫХ
Глава 10. Открытые данные
Глава 11. Протокол HTTP
Глава 12. Импорт данных
Глава 13. Веб-скрапинг
Глава 14. Пакет rvest
Глава 15. RSelenium: управляем браузером
Глава 16. PhantomJS и обработка динамических
веб-страниц
Глава 17. Facebook
Глава 18. Сбор информации с помощью API
ВКонтакте
Глава 19. Использование Twitter API
Глава 20. Регулярные выражения
Глава 21. Создание карт на основе собранных
данных
Ссылки к части II
Приложение А. Среда разработки RStudio
Приложение Б. Языки поисковых запросов Google и
Яндекс
Приложение В. Введение в HTML и CSS
Приложение Г. Регулярные выражения
Предметный указатель

О книге

Автор(ы)
РазделПрограммирование
ИздательДМК-Пресс
ISBN978-5-9706-0459-5
Год издания2017
Количество страниц282
Формат141x200мм
Вес0.29кг
Кол-во страниц282
ПереплетМягкий переплёт
Возрастные ограничения12
Вес, в граммах290
ИздательствоДМК-Пресс
Тип обложкимягкая
Назначениедля технических ВУЗов
Количество книг1
Оформление обложкилакировка
АвторХрамов Дмитрий Александрович
Размеры60x90/16
Язык изданияРусский
Обложкамягкая обложка

Отзывы (7)

  • 5/5

    Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
    Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
    Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
    Только для опытных пользователей R, которым надо работать с сайтами.
    Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что

    0    0

  • 1/5

    Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!

    0    0

  • 1/5

    Резюме: книга очень поверхностная, создается впечатление, что она написана как выжимка из документации и форумов по языку R, без разъяснений, без указания причинно-следственных связей. Все примеры очень примитивные. После прочтения данной книги отсутствует малейший шанс на создание программы для сбора информации даже с одной страницы.
    Желаю автору сил для серьезной переработки представленного материала, а покупателям – обходить данную книгу стороной, не тратить время на ее прочтение, а тем более изучение. Гораздо эффективнее, если приглянулся язык R, приобрести специализированную книгу по языку R, далее, книгу по фундаментальным алгоритмам и форматам данных.

    Достоинства:

    Стоимость – недорого, но не рекомендую к покупке.

    Недостатки:

    Купил книгу, почитав отзывы.
    Все содержимое книги можно передать так:
    1. Используем язык R
    почему? – Вы можете использовать и язык С (почему именно С, а не Java, C#, Python, MatLAB…?), но лучше всего, использовать этот язык, он создан статистиками для статистиков
    а как же мы не смогли сразу догадаться? А может выбор следует делать на основе возможностей языка, порога вхождения пользователя, наличия конкретных библиотек, реализованных проектов?
    2. Первая часть книги (около 100 стр.) посвящена языку R?
    3. Как установить R? – очень просто, зайдите на официальный сайт и выбирайте интересующую версию программу
    куда заходить? Как выбрать? Какие версии имеются? Что такое старый R ?
    4. Далее – очень коротко о языке R, на 100 страницах, а по сути можно было уложится максимум в 8-10 (написанное автором является чересчур лаконичным для начинающих, а для тех, кто хоть немного сталкивался с написанием алгоритмических программ, – 90 страниц воды).
    5. Вторая часть книги изложена в следующем виде:
    - методология: заходим в интернет (Вы уже успешно делаете это каждый день?), скачиваем информацию и вызываем функцию языка R. Все, дело сделано.
    - сами функции: нужно распознать таблицу – подайте часть html-страницы на вход функции html_table
    вопрос: а как узнать, есть вообще таблица на странице? Одна она или их несколько? Как работает функция? Какие разделители строк и ячеек использует эта функция – это Вы догадаетесь сами
    а как быть, если в таблице имеется заголовок, рисунок, несколько строк в одной ячейке? Этого нет в книге
    а как распознать сложные случаи? Используйте регулярные выражения (конечно же, этого указания достаточно для читателей, которые прочли 100 страниц, как присваивать переменные, строить графики, делать циклы).

    0    0

Добавить отзыв



4 ms.

 

Машинное обучение. Анализ данных - издательство "ДМК-Пресс"

Категория 332 р. - 498 р.

Программирование - издательство "ДМК-Пресс" »

1 ms.

Машинное обучение. Анализ данных

Категория 332 р. - 498 р.

ADS
закладки (0) сравнение (0)

 

preloader

33 ms