Матовая таблица/Оптимизация типа набора данных

Я ищу некоторые оптимизированные типы данных для таблицы "наблюдения-переменные" в Matlab, которые могут быть быстро и легко доступны столбцами (через переменные) и строками (через наблюдения).

Ниже приведены сопоставления существующих типов данных Matlab:

Интересно, могу ли я использовать более простую и оптимизированную версию типа данных таблицы, если я хочу просто комбинировать индексирование номера строки и столбцов с помощью только числовых переменных -OR- любой тип переменной.

Ответы

Ответ 1

Я бы использовал матрицы, так как они самые быстрые и простые в использовании, а затем создают набор перечислимых меток столбцов, чтобы упростить индексирование столбцов. Вот несколько способов сделать это:

Используйте объект `containers.Map`:

Учитывая ваши имена переменных и предполагая, что они отображаются в порядке от столбцов от 1 до N, вы можете создать такое сопоставление:

varNames = {'A','B','C','D','E','F','G','H','I','J','K','L','M','N','O'};
col = containers.Map(varNames, 1:numel(varNames));

И теперь вы можете использовать карту для доступа к столбцам ваших данных по имени переменной. Например, если вы хотите получить столбцы для переменных A и C (т.е. Первый и третий) из матрицы data, вы должны сделать это:

subData = data(:, [col('A') col('C')]);

Используйте `struct`:

Вы можете создать структуру с именами переменных в качестве своих полей и соответствующих индексов столбцов в качестве их значений:

enumData = [varNames; num2cell(1:numel(varNames))];
col = struct(enumData{:});

И вот что col содержит:

struct with fields:

  A: 1
  B: 2
  C: 3
  D: 4
  E: 5
  F: 6
  G: 7
  H: 8
  I: 9
  J: 10
  K: 11
  L: 12
  M: 13
  N: 14
  O: 15

И вы получите доступ к столбцам A и C следующим образом:

subData = data(:, [col.A col.C]);
% ...or with dynamic field names...
subData = data(:, [col.('A') col.('C')]);

Сделайте кучу переменных:

Вы можете просто создать переменную в своей рабочей области для каждого имени столбца и сохранить в ней индексы столбцов. Это будет загрязнять ваше рабочее пространство с помощью большего количества переменных, но дает вам краткое описание доступа к данным столбца. Вот простой способ сделать это, используя сильно оскорбленный eval:

enumData = [varNames; num2cell(1:numel(varNames))];
eval(sprintf('%s=%d;', enumData{:}));

И доступ к столбцам A и C выполняется так же легко, как:

subData = data(:, [A C]);

Используйте класс перечисления:

Это, вероятно, хорошая доза избытка, но если вы собираетесь использовать одно и то же сопоставление меток столбцов и индексов для многих анализов, вы можете создать класс перечисления, сохраните его где-нибудь на своем путь MATLAB, и вам больше не придется беспокоиться о том, чтобы снова определить свои столбцы. Например, здесь класс ColVar с 15 перечисляемыми значениями:

classdef ColVar < double
  enumeration
    A (1)
    B (2)
    C (3)
    D (4)
    E (5)
    F (6)
    G (7)
    H (8)
    I (9)
    J (10)
    K (11)
    L (12)
    M (13)
    N (14)
    O (15)
  end
end