Сбор данных в Интернете на языке R (Храмов Дмитрий Александрович) ; ДМК-Пресс, 2017
от 415 р. до 1989 р.
Автор(ы): Храмов Дмитрий Александрович;
Издатель: ДМК-Пресс
ISBN: 978-5-97060-459-5
ID: SKU25077
Сравнить цены
Цена от 415 р. до 1989 р. в 9 магазинах
Магазин | Цена | Наличие |
---|---|---|
Лабиринт 5/5 | 1443 р. 2062 р. | |
Буквоед 5/5 | 1989 р. Минимальная сумма заказа 100 рублей | |
ЛитРес 5/5 | 415 р. 519 р. электронная книга | скачать фрагмент | |
Book24 5/5 | 1989 р. | |
Яндекс.Маркет 5/5 | 1356 р. | |
МАЙШОП 5/5 | 1252 р. 1925 р. | |
Читай-город 5/5 | 1499 р. | наличие уточняйте 02.12.2023 |
Мегамаркет 5/5 | 1415 р. 2359 р. | наличие уточняйте 13.04.2024 |
OZON | 913 р. | наличие уточняйте 03.01.2024 |
AliExpress 5/5 | ||
Описание
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
Смотри также Характеристики.
Яндекс.Маркет
Содержание
ЧАСТЬ I. ПРОГРАММИРОВАНИЕ НА R
Глава 1. Знакомство с R
Глава 2. Скаляры, векторы и матрицы
Глава 3. Списки и таблицы
Глава 4. Управление процессом вычислений
Глава 5. Базовая графика
Глава 6. Функции
Глава 7. Факторы и даты
Глава 8. Пакеты
Глава 9. Ввод и вывод данных. Работа с файлами
ЧАСТЬ II. СБОР ДАННЫХ
Глава 10. Открытые данные
Глава 11. Протокол HTTP
Глава 12. Импорт данных
Глава 13. Веб-скрапинг
Глава 14. Пакет rvest
Глава 15. RSelenium: управляем браузером
Глава 16. PhantomJS и обработка динамических
веб-страниц
Глава 17. Facebook
Глава 18. Сбор информации с помощью API
ВКонтакте
Глава 19. Использование Twitter API
Глава 20. Регулярные выражения
Глава 21. Создание карт на основе собранных
данных
Ссылки к части II
Приложение А. Среда разработки RStudio
Приложение Б. Языки поисковых запросов Google и
Яндекс
Приложение В. Введение в HTML и CSS
Приложение Г. Регулярные выражения
Предметный указатель
О книге
Автор(ы) | Храмов Дмитрий Александрович |
Раздел | Программирование |
Издатель | ДМК-Пресс |
ISBN | 978-5-9706-0459-5 |
Год издания | 2017 |
Количество страниц | 282 |
Формат | 141x200мм |
Вес | 0.29кг |
Кол-во страниц | 282 |
Переплет | Мягкий переплёт |
Возрастные ограничения | 12 |
Вес, в граммах | 290 |
Издательство | ДМК-Пресс |
Тип обложки | мягкая |
Назначение | для технических ВУЗов |
Количество книг | 1 |
Оформление обложки | лакировка |
Автор | Храмов Дмитрий Александрович |
Размеры | 60x90/16 |
Язык издания | Русский |
Обложка | мягкая обложка |
Отзывы (7)
-
ilja.slugin
- 21 октября 20215/5
Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
Только для опытных пользователей R, которым надо работать с сайтами.
Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что0 0
-
Ilyasikm
- 30 октября 20191/5
Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!
0 0
-
Дмитрий
- 5 апреля 20181/5
Резюме: книга очень поверхностная, создается впечатление, что она написана как выжимка из документации и форумов по языку R, без разъяснений, без указания причинно-следственных связей. Все примеры очень примитивные. После прочтения данной книги отсутствует малейший шанс на создание программы для сбора информации даже с одной страницы.
Желаю автору сил для серьезной переработки представленного материала, а покупателям – обходить данную книгу стороной, не тратить время на ее прочтение, а тем более изучение. Гораздо эффективнее, если приглянулся язык R, приобрести специализированную книгу по языку R, далее, книгу по фундаментальным алгоритмам и форматам данных.Достоинства:
Стоимость – недорого, но не рекомендую к покупке.
Недостатки:
Купил книгу, почитав отзывы.
Все содержимое книги можно передать так:
1. Используем язык R
почему? – Вы можете использовать и язык С (почему именно С, а не Java, C#, Python, MatLAB…?), но лучше всего, использовать этот язык, он создан статистиками для статистиков
а как же мы не смогли сразу догадаться? А может выбор следует делать на основе возможностей языка, порога вхождения пользователя, наличия конкретных библиотек, реализованных проектов?
2. Первая часть книги (около 100 стр.) посвящена языку R?
3. Как установить R? – очень просто, зайдите на официальный сайт и выбирайте интересующую версию программу
куда заходить? Как выбрать? Какие версии имеются? Что такое старый R ?
4. Далее – очень коротко о языке R, на 100 страницах, а по сути можно было уложится максимум в 8-10 (написанное автором является чересчур лаконичным для начинающих, а для тех, кто хоть немного сталкивался с написанием алгоритмических программ, – 90 страниц воды).
5. Вторая часть книги изложена в следующем виде:
- методология: заходим в интернет (Вы уже успешно делаете это каждый день?), скачиваем информацию и вызываем функцию языка R. Все, дело сделано.
- сами функции: нужно распознать таблицу – подайте часть html-страницы на вход функции html_table
вопрос: а как узнать, есть вообще таблица на странице? Одна она или их несколько? Как работает функция? Какие разделители строк и ячеек использует эта функция – это Вы догадаетесь сами
а как быть, если в таблице имеется заголовок, рисунок, несколько строк в одной ячейке? Этого нет в книге
а как распознать сложные случаи? Используйте регулярные выражения (конечно же, этого указания достаточно для читателей, которые прочли 100 страниц, как присваивать переменные, строить графики, делать циклы).0 0
Добавить отзыв
Машинное обучение. Анализ данных - издательство "ДМК-Пресс"
Категория 332 р. - 498 р.
Программирование - издательство "ДМК-Пресс" »
Машинное обучение. Анализ данных
Категория 332 р. - 498 р.