November 2013
R-скрипка для анализа данных онлайн
R-fiddle является сайтом, позволяющим работать с языком R онлайн. Верхняя левая часть является аналогом файла R-script, а нижняя - программной строкой. Среди прочего сайт позволяет загружать библиотеки и массивы данных (предварительно их необходимо разместить онлайн - соответствующий адрес будет путем к файлу данных). Результаты анализа выводятся снизу слева (текстовая часть) и справа (графики). Скрипты можно сохранять онлайн (создается уникальная ссылка) и использовать в дальнейшем. С другими нюансами надо разбираться :)
Для примера я создал в R-fiddle страницы с кодом из предыдущей статьи по циклам: шахматы, хоббиты.
Для примера я создал в R-fiddle страницы с кодом из предыдущей статьи по циклам: шахматы, хоббиты.
Comments
Основы программирования: циклы
22/11/13 23:24 Относится к категории: Анализ данных | R
Согласно Wiki, "цикл — разновидность управляющей конструкции в высокоуровневых языках программирования, предназначенная для организации многократного исполнения набора инструкций... Последовательность инструкций, предназначенная для многократного исполнения, называется телом цикла. Единичное выполнение тела цикла называется итерацией. Выражение определяющее, будет в очередной раз выполняться итерация, или цикл завершится, называется условием выхода или условием окончания цикла (либо условием продолжения в зависимости от того, как интерпретируется его истинность — как признак необходимости завершения или продолжения цикла). Переменная, хранящая текущий номер итерации, называется счётчиком итераций цикла или просто счётчиком цикла". Читать дальше...
Тестовая версия RStudio для OS X Mavericks
Хорошие новости для пользователей RStudio на Маке. Вчера вышла новая тестовая версия для OS X Mavericks (10.9). Старая версия под новую ось притормаживала. Качать отсюда:
http://www.rstudio.com/ide/download/preview
Управление данными: работа с переменными
10/11/13 14:44 Относится к категории: Анализ данных | R
Довольно часто подготовка к анализу может занимать намного больше времени, чем сам анализ. Поэтому проблемы управления данными занимают важное место в аналитическом процессе. И поскольку R является не только средой статистической обработки данных, но и языком программирования, он предоставляет множество инструментов по управлению данными.
В сегодняшней статье я хочу коснуться только части из них, а именно: вычисления новых переменных, перекодировки имеющихся, работы с пропущенными значениями, "склеивания" массивов, выборки переменных и наблюдений. Читать дальше...
Работа с переменными-факторами. Влияние типа переменной на особенности анализа
02/11/13 15:08 Относится к категории: Анализ данных | R
R выдвигает достаточно жесткие требования к организации данных. В частности это касается категориальных (номинальных и порядковых) переменных, которые называются в R факторами. В сегодняшней статье я коснусь особенностей создания факторов, ограничений, связанных с их обработкой, а также возможностей, предоставляемых R Commander при работе с ними. Текст статьи предполагает вашу осведомленность с типами переменных. Освежить соответствующие знания можно здесь, здесь и здесь.