Самостоятельное создание сайта
Самостоятельная раскрутка и продвижение сайта
06 ноября 2010

Google Refine - преобразование сырых данных в нужную форму

Google предлагает проект с открытым кодом, который заслуживает внимания - Google Refine. Это отличный инструмент для очистки наборов данных и для выполнения сложных операций с данными, таких как преобразование из одного формата в другой, преобразования данных.

Google Refine это новый инструмент от Google, который вам понадобиться, если нужно работать с наборами данных. Конечно, существует множество программ для работы с наборами данных - даже Microsoft Excel или Open Office Calc может предоставить много решений для вас и сделать обработку данных, но если у вас есть действительно большой набор данных, полный всевозможных несоответствий, то с Excel и Calc вы затратите много времени (это может быть несколько дней или недель, если набор данных очень большой), пока вы преобразуете ваши данные в нужную форму.

Конечно, Microsoft Excel и Open Office Calc не означает, что это профессиональные инструменты для обработки данных и вы не можете ожидать от них чудес. Но что делать, если у вас есть набор размером с гигабайт данных, и вам нужно, очистить его и желательно как можно скорее? Обратитесь к Google Refine, конечно!

Freebase Gridworks превратился в Google Refine

Концепция Google Refine, не нова. Даже код и реализация, не являются новыми, потому что Google Refine является реинкарнацией Freebase Gridworks. Google купил с открытым исходным кодом Freebase Gridworks в июле и только спустя несколько месяцев выпустил первый Google-фирменную версию программного обеспечения. Google Refine была выпущена сразу, как версии 2.0 и открытый код, а также двоичный код для многих платформ, вы можете загрузить теперь отсюда.

Никаких ограничений по операциям с данными с Google Refine

Для всех, кто имел дело с сырыми данными, Google Refine это просто подарок. Видеоролики объяснит удивительные вещи и какие операции можно выполнять с помощью Google Refine. Очистка грязных данных только в одну функцию, преобразования данных (из одного формата в другой) и увеличение данных с помощью построение форм из источника сырых данных.

Google Refine, безусловно, очень продвинутый инструмент, но он прост в использовании, и даже пользователи с общими навыками работы с ПК смогут использовать его для выполнения сложных манипуляций с данными. Существует возможность отменить все проведенные операции, так что вы можете быстро вернуться в исходное состояние и безопасно проводить любые експеременты с данными.

Среди других полезных возможностей в Google Refine 2.0 это возможность расширения текущего набор данных с данными из внешних источников, таких как веб-сервисы, и Ваши данные будут по-прежнему доступны для возвращение в исходное состояние после всех этих операций.

Можно также связать записи из Google Refine с внешними базами данных, например, Freebase. Все эти особенности делают Google Refine очень полезным инструментом для всех, кто имеет дело с какие-либо операциями с наборами данных.

Дополнительно

Другие новости