Гранд тур (визуализация данных) - Grand Tour (data visualisation) - Wikipedia

В большое путешествие это метод, разработанный Даниэлем Азимовым в 1985 году, который используется для исследования многомерные статистические данные с помощью анимации. Анимация, или «фильм», состоит из серии отдельных видов данных, видимых с разных сторон, отображаемых на экране компьютера, которые кажутся постоянно меняющимися и которые становятся все ближе и ближе ко всем возможным видам. Это позволяет человеку или компьютеру оценивать эти представления с целью обнаружения закономерностей, которые будут передавать полезную информацию о данных.

Этот прием похож на то, что делают многие посетители музея, когда сталкиваются со сложной абстрактной скульптурой: они ходят вокруг нее, чтобы рассмотреть ее со всех сторон, чтобы лучше понять ее. Человеческая зрительная система воспринимает визуальную информацию как рисунок на сетчатке, который является двумерным. Таким образом, обход скульптуры, чтобы лучше понять ее, создает временную последовательность двумерных изображений в мозгу.

Многомерные данные, которые являются исходными входными данными для любой визуализации большого тура, представляют собой (конечный) набор точек в некотором многомерном евклидовом пространстве. Такой набор возникает естественным образом при сборе данных. Предположим, что для некоторого населения из 1000 человек каждого человека просят указать свой возраст, рост, вес и количество волос в носу. Таким образом, с каждым членом населения связана упорядоченная четверка чисел. С п-мерное евклидово пространство определенный как и все упорядоченные наборы чисел, это означает, что данные о 1000 человек можно рассматривать как 1000 точек в 4-мерном евклидовом пространстве.

Большой тур преобразует пространственную сложность многомерного набора данных во временную сложность с использованием относительно простых двумерных представлений проецируемых данных в качестве отдельных кадров фильма. (Иногда их называют «просмотры данных».) Обычно проекции выбираются таким образом, чтобы они не менялись слишком быстро, что означает, что будет отображаться видеоизображение данных. непрерывный человеку-наблюдателю.

«Метод» большого тура - это алгоритм для назначения последовательности проекций на (обычно) 2-мерные плоскости любому заданному измерению евклидова пространства. Это позволяет проецировать любой конкретный многомерный набор данных на эту последовательность двухмерных плоскостей и, таким образом, отображать на экране компьютера одну за другой, так что эффект заключается в создании фильма данных.

(Обратите внимание, что после того, как данные были спроецированы на заданную 2-плоскость, то для отображения их на экране компьютера необходимо выбрать направления в этой 2-плоскостях, которые будут соответствовать горизонтальному и вертикальному направлениям на экран компьютера. Обычно это второстепенная деталь. Но в идеале выбор горизонтального и вертикального направлений должен быть сделан таким образом, чтобы свести к минимуму любое ненужное кажущееся "вращение" двумерного представления данных.)

Техническое описание

Каждый "вид" (т. Е. Кадр) анимации - это ортогональная проекция набора данных на двумерное подпространство евклидова пространства рп где находятся данные. Подпространства выбираются небольшими шагами вдоль непрерывной кривой, параметризованной временем, в пространстве всех 2-мерных подпространств рп, известный как Грассманиан грамм(2,п). Чтобы отобразить эти виды на экране компьютера, необходимо выбрать одно конкретное положение поворота каждого вида (в плоскости экрана компьютера) для отображения. Это приводит к тому, что положение точек данных на экране компьютера постоянно меняется. Азимов показал, что эти подпространства можно выделить так, чтобы их множество (до временит) все ближе ко всем точкам в грамм(2,п), так что, если бы фильму grand tour было разрешено работать бесконечно, набор отображаемых подпространств соответствовал бы плотное подмножество из грамм(2,п).[1][2]

Программного обеспечения

- The турр р В пакете реализованы функции геодезической интерполяции и генерации базиса, которые позволяют создавать новые методы тура из R.


Рекомендации

  1. ^ Азимов, Даниил. (1985). Большой тур: инструмент для просмотра многомерных данных. Журнал SIAM по научным и статистическим вычислениям, 6(1), 128–143.
  2. ^ Ха, Мун Юл и Киёль Ким. (2002) Визуализация многомерных данных с использованием модификаций Grand Tour. Журнал прикладной статистики 29.5: 721–728.