Сбор данных в Интернете на языке R (Храмов Дмитрий Александрович) ; ДМК-Пресс, 2017

от 415 р. до 1989 р.

Автор(ы): Храмов Дмитрий Александрович;
Издатель: ДМК-Пресс
ISBN: 978-5-97060-459-5
все характеристики
ID: SKU25077

Рейтинг:

(3.6/5)

Отзывы (7) Написать отзыв

Цены (9)Описание Содержание О книге Отзывы (7)

Сравнить цены

Цена от 415 р. до 1989 р. в 9 магазинах

Магазин	Цена	Наличие
Лабиринт 5/5 ООО "ЛАБИРИНТ.РУ" ИНН: 7728644571	1443 р. 2062 р. история цены
Буквоед 5/5 ООО «Новый Книжный Центр» ИНН: 7710422909	1989 р. Минимальная сумма заказа 100 рублей история цены
ЛитРес 5/5 ООО"Литрес" ИНН: 7719571260	415 р. 519 р. электронная книга \| скачать фрагмент история цены
Book24 5/5 ООО "Новый Книжный Центр" ИНН: 7710422909	1989 р. история цены
Яндекс.Маркет 5/5 ООО "ЯНДЕКС" ИНН: 7736207543	1356 р. история цены
МАЙШОП 5/5 ООО "МАГАЗИН КНИГ" ИНН: 9725076959	1252 р. 1925 р. история цены
Читай-город 5/5 ООО "Новый Книжный Центр" ИНН: 7710422909	1499 р. история цены	наличие уточняйте 02.12.2023
Мегамаркет 5/5 ООО "МАРКЕТПЛЕЙС" ИНН: 9701048328	1415 р. 2359 р. история цены	наличие уточняйте 13.04.2024
OZON	913 р. история цены	наличие уточняйте 03.01.2024
AliExpress 5/5 ООО "АЛИБАБА.КОМ (РУ)" ИНН: 7703380158

Как купить или где мы находимся +

Описание

Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.

Смотри также Характеристики.

Яндекс.Маркет

Содержание

Введение
ЧАСТЬ I. ПРОГРАММИРОВАНИЕ НА R
Глава 1. Знакомство с R
Глава 2. Скаляры, векторы и матрицы
Глава 3. Списки и таблицы
Глава 4. Управление процессом вычислений
Глава 5. Базовая графика
Глава 6. Функции
Глава 7. Факторы и даты
Глава 8. Пакеты
Глава 9. Ввод и вывод данных. Работа с файлами
ЧАСТЬ II. СБОР ДАННЫХ
Глава 10. Открытые данные
Глава 11. Протокол HTTP
Глава 12. Импорт данных
Глава 13. Веб-скрапинг
Глава 14. Пакет rvest
Глава 15. RSelenium: управляем браузером
Глава 16. PhantomJS и обработка динамических
веб-страниц
Глава 17. Facebook
Глава 18. Сбор информации с помощью API
ВКонтакте
Глава 19. Использование Twitter API
Глава 20. Регулярные выражения
Глава 21. Создание карт на основе собранных
данных
Ссылки к части II
Приложение А. Среда разработки RStudio
Приложение Б. Языки поисковых запросов Google и
Яндекс
Приложение В. Введение в HTML и CSS
Приложение Г. Регулярные выражения
Предметный указатель

О книге


Автор(ы)	Храмов Дмитрий Александрович
Раздел	Программирование
Издатель	ДМК-Пресс
ISBN	978-5-9706-0459-5
Год издания	2017
Количество страниц	282
Формат	141x200мм
Вес	0.29кг
Кол-во страниц	282
Переплет	Мягкий переплёт
Возрастные ограничения	12
Вес, в граммах	290
Издательство	ДМК-Пресс
Тип обложки	мягкая
Назначение	для технических ВУЗов
Количество книг	1
Оформление обложки	лакировка
Автор	Храмов Дмитрий Александрович
Размеры	60x90/16
Язык издания	Русский
Обложка	мягкая обложка

Отзывы (7)

ilja.slugin
- 21 октября 2021

5/5

Книга в своем роде уникальная. Аналогичную информацию можно найти только на английском, и то если знать что искать и приложить усилия. Пакеты httr, RCurl, rverse – достаточный набор для простенького парсинга, который может понадобиться человеку, работающему с данными.
Пакет для работы с данными мирового банка – подарок для ученых-социологов, экономистов и т.п. Намного удобнее, чем рыться в интернете.
Некоторые моменты в книге устарели, но разобраться труда не составит. Плюс примеры неудачно подобраны, для практики придется подбирать свои ссылки.
Только для опытных пользователей R, которым надо работать с сайтами.
Это не самоучитель для новичков. Если вы не знаете базовый синтаксис и пакет tidyverse, то лучше эту книгу не читать пока что
0 0
Ilyasikm
- 30 октября 2019

1/5

Полкниги воды, что за манера пошла у авторов утяжелить книгу водой? Дороже стоить будет? Нет примера выгрузки данных с сайтов под Java! Если этого нет, книга фуфло!
0 0
Дмитрий
- 5 апреля 2018

1/5

Резюме: книга очень поверхностная, создается впечатление, что она написана как выжимка из документации и форумов по языку R, без разъяснений, без указания причинно-следственных связей. Все примеры очень примитивные. После прочтения данной книги отсутствует малейший шанс на создание программы для сбора информации даже с одной страницы.
Желаю автору сил для серьезной переработки представленного материала, а покупателям – обходить данную книгу стороной, не тратить время на ее прочтение, а тем более изучение. Гораздо эффективнее, если приглянулся язык R, приобрести специализированную книгу по языку R, далее, книгу по фундаментальным алгоритмам и форматам данных.
Достоинства:

Стоимость – недорого, но не рекомендую к покупке.
Недостатки:

Купил книгу, почитав отзывы.
Все содержимое книги можно передать так:
1. Используем язык R
почему? – Вы можете использовать и язык С (почему именно С, а не Java, C#, Python, MatLAB…?), но лучше всего, использовать этот язык, он создан статистиками для статистиков
а как же мы не смогли сразу догадаться? А может выбор следует делать на основе возможностей языка, порога вхождения пользователя, наличия конкретных библиотек, реализованных проектов?
2. Первая часть книги (около 100 стр.) посвящена языку R?
3. Как установить R? – очень просто, зайдите на официальный сайт и выбирайте интересующую версию программу
куда заходить? Как выбрать? Какие версии имеются? Что такое старый R ?
4. Далее – очень коротко о языке R, на 100 страницах, а по сути можно было уложится максимум в 8-10 (написанное автором является чересчур лаконичным для начинающих, а для тех, кто хоть немного сталкивался с написанием алгоритмических программ, – 90 страниц воды).
5. Вторая часть книги изложена в следующем виде:
- методология: заходим в интернет (Вы уже успешно делаете это каждый день?), скачиваем информацию и вызываем функцию языка R. Все, дело сделано.
- сами функции: нужно распознать таблицу – подайте часть html-страницы на вход функции html_table
вопрос: а как узнать, есть вообще таблица на странице? Одна она или их несколько? Как работает функция? Какие разделители строк и ячеек использует эта функция – это Вы догадаетесь сами
а как быть, если в таблице имеется заголовок, рисунок, несколько строк в одной ячейке? Этого нет в книге
а как распознать сложные случаи? Используйте регулярные выражения (конечно же, этого указания достаточно для читателей, которые прочли 100 страниц, как присваивать переменные, строить графики, делать циклы).
0 0