Становимся специалистами в Tableau Desktop – Часть 1. Создание и сохранение подключений к данным
Добро пожаловать!
Давайте начнем с первого навыка, который у вас будут оценивать на экзамене Tableau Desktop Specialist: Подключение и подготовка данных. Сейчас мы узнаем, как создать и сохранять подключение к данным.
«Создать живое соединение с источником данных»
Прежде всего, когда вы открываете Tableau, слева на Connect Pane (Панель подключения) вы увидите возможные варианты подключения источника данных. Вы можете выбрать между подключением к файлу или серверу (нажмите “More…” (Еще…), чтобы просмотреть все возможности). В нижней части панели подключения вы найдете сохраненные источники данных. (Вы найдете нужную информацию на этой странице справки Tableau Help.)
«Объясните разницу между использованием живых связей и выборок данных»
Следующий ваш навык, который будут оценивать – понимание различий между использованием живых связей и выборок. Вы без проблем найдете много информации по этой теме, и авторы объясняют ее весьма доступно. Я вряд ли смогу подобрать более подходящие слова, чтобы описать это, поэтому позвольте мне процитировать вам одного специалиста.
«Живые соединения позволяют удобно обновляться в режиме реального времени, а любые изменения в источнике данных сразу же отражаются в Tableau. Но живые соединения также полагаются на базу данных для всех запросов. И в отличие от выборок, базы данных не всегда оптимизированы для быстрой работы. При оперативных соединениях ваши запросы данных выполняются так же быстро, как работает сама база данных». – Диего Медрано
«Выборки данных в Tableau – это сжатый «снимок данных», сохраненный на диске и загруженный в память, что требуется для визуализации Tableau» - Гордон Роуз
«Когда вы создаете выборку из локального файла (например .csv или книгу Excel) или локальной базы данных, вы ускоряете вашу книгу за счет оптимизации. В результате Tableau не требуется база данных для построения визуализации. Вместо этого обработчик данных Tableau в памяти напрямую запрашивает выборку». - Диего Медрано
Самым большим преимуществом выборки данных является то, что Tableau может работать быстрее, особенно когда визуализация довольно сложная и включает большой набор данных, множество вычислений, фильтров и т. д. В свою очередь, вы теряете возможность обновляться в реальном времени. Вот почему вы должны обновить свои данные.
Мастер дзен Райан Слипер в своей книге ‘Practical Tableau’ (Практический Tableau) указывает, что вам не нужна выборка, когда ваш набор данных хранится в мощных базах данных в памяти. В этом случае рекомендуется работать с действующими соединениями.
Моими словами
Объяснение включает два слова, которые я понял не сразу: «On-premise database» (Локальная база данных) и «In-memory data engine» (Система обработки данных в памяти). Для тех из вас, у кого тоже нет четкого понимания этих терминов, возможно, помогут мои дальнейшие заметки.
«On-premise» (локально) относится к базе данных, которая управляется и поддерживается локально в самой компании. Противоположностью локальной базы данных является облачная база данных. В этом случае доступ к базе данных предоставляется как услуга.
Пытаясь выяснить, что означает «In-memory data engine» (Система обработки данных в памяти), Google дает пояснения только к «in-memory database» (База данных в памяти). Звучит хорошо, но я не уверен, что база данных и система обработки данных используются как синонимы. К счастью, я нашел следующее пояснение: «Система обработки данных – это «специально созданная аналитическая база данных для выборок».
Вот почему я делаю вывод, что объяснение баз данных в памяти также подойдет для системы обработки данных в памяти.
Так что же это такое:
Основное различие между базой данных в памяти и традиционной (локальной) базой данных состоит в том, что база данных в памяти хранится в основной памяти компьютера (RAM), в отличие от традиционной базы данных, хранящейся на дисках. По этой причине выборка загружается быстрее: доступ к оперативной памяти происходит быстрее, чем к дисководу.
Найдите мои дополнительные источники для этого параграфа ниже:
- Объяснение «на месте» от hpe
- Объяснение «облачной базы данных» из Википедии
- «База данных в памяти» от FlipHTML5
- Различие между базой данных в памяти и традиционной базой данных от ramia
«Создать выборку»
Теперь пришло время узнать, как создать выборку в Tableau. Есть два варианта ее создания. Первый вы можете увидеть в верхнем правом углу интерфейса редактирования данных.
Для второго вы должны открыть интерфейс авторинга. Теперь вы можете нажать на источник данных и выбрать «Извлечь данные…». Эта опция также предлагает возможности для фильтрации ваших данных.
После создания выборки значок изменился с одного цилиндра на два цилиндра со стрелкой на нем. Каждый раз, когда вы видите такой символ, вы будете знать, что данные извлекались в более быстрый механизм обработки данных.
Найти всю информацию о создании выборок также в этом видео с веб-сайта Tableau.
«Сохранить свойства метаданных в TDS»
Наконец, наша последняя тема на сегодня – как сохранить свойства метаданных в TDS.
Что означают «метаданные» для нашей работы в Tableau?
Прежде всего, нам нужно знать, что именно означают метаданные. Как правило, метаданные определяются как «данные, которые предоставляют информацию о других данных».
Tableau отлично справляется со своей работой и узнает много подробностей о наших данных. Например, Tableau часто автоматически выделяет правильный тип данных, например, географическую роль.
Но для организации наших данных нам еще есть над чем поработать. Я нашел следующий список самых популярных примеров:
- Переименовать переменную
- Группировать переменные в папки
- Иерархия
- Расчетные поля
- Группы
- Наборы
- Параметры (Примечание. Файл TDS сохраняет параметр только в том случае, если на него ссылается вычисляемое поле)
- Размер или мера
- Дискретный или непрерывный
- Тип данных
- Географическая роль
- Свойства по умолчанию (включая комментарии, цвет, форматы чисел, агрегацию и итоги)
Файл TDS сохранит все ваши изменения в метаданных.
Источники, которые я использовал для этого абзаца:
- Определение метаданных от web.archieve
- Список примеров от Interworks
- Модель метаданных Tableau от Tableau Software
Сохранить метаданные
Давайте перейдем к той главной теме, которую мы хотим обсудить: как сохранить источник данных со всеми метаданными. Поэтому вы можете щелкнуть на самом источнике данных и выбрать «Add to Saved Data Sources…» (Добавить в сохраненные источники данных…).
Теперь Tableau сохранит соединение как «.tds». Если вы выбрали каталог по умолчанию, Tableau отобразит источник данных в нижней части панели подключения. Но вы, конечно, можете выбрать любой другой каталог для сохранения вашего файла .tds.
Примечание: «Это не сами данные, а информация о соединении». В результате, если вы смените место хранения данных, соединение больше не будет работать. Вы должны найти исходный источник данных в ваших .tds, прежде чем начать работать с ним.
Публикация источников данных
Другим вариантом сохранения источников данных является их публикация на сервере Tableau или в Tableau Online. Так, вы нажимаете на серверное меню и даете команду опубликовать источник данных. Затем выберите источник данных, который вы хотите опубликовать.
Подробное описание того, как опубликовать источник данных, вы можете найти здесь на веб-сайте Tableau.
Дополнительную информация с веб-сайта Tableau: вы найдете здесь – хороший обзор типов файлов и папок.