Сопряженные целые разделы на месте
Я создаю библиотеку С++, которая включает класс разделов. Я пытаюсь реализовать сопряжение (объяснено ниже) на месте, и я не могу заставить его работать.
Мои члены класса:
size_t _size;
size_t _length;
std::vector<int> _parts;
В качестве примера целочисленное разбиение [5,4,4,1]
имеет
_size = 14 // 5 + 4 + 4 + 1
_length = 4 // 4 nonzero parts
_parts[0] = 5
_parts[1] = 4
_parts[2] = 4
_parts[3] = 1
_parts[i] = junk // i>3
Если раздел [m_1,m_2,...,m_k]
, то сопряженное с ним [n_1,n_2,...,n_l]
, где
l = m_1 // length and the first part are switched
n_i = sum{ m_j | m_j > i}
Например, сопряжение [5,4,4,1]
составляет [4,3,3,3,1]
. Другой способ увидеть это - выделить раздел как строки единичных квадратов, где число квадратов в i
-й строке равно m_i
. Чтение высот столбцов дает сопряженное. В этом же примере изображение
1| x
4| x x x x
4| x x x x
5| x x x x x
__________
4 3 3 3 1
Математика переведена в синтаксис программирования как m_i = _parts[i-1]
и k = _length
. Здесь сломанная реализация для сопряжения:
void
Partition::conjugate() {
size_t k = _length;
_length = _parts[0];
int newPart;
for (int i=(int)_length; i>0; --i) {
newPart = 0;
for (int j=0; j<k; ++j) {
if (_parts[j] >= i) newPart++;
else break;
}
_parts[i-1] = newPart;
}
}
Это работает много времени, но иногда он перезаписывает часть раздела, которая по-прежнему необходима. Я ищу умный способ сделать сопряжение на месте, т.е. Без создания нового экземпляра Partition
.
Еще один способ думать о сопряжении состоит в том, чтобы понять, что сопряжение является следующей последовательностью
k...k (k-1)...(k-1) ... 1...1
x m_k x(m_(k-1)-m_k) x(m_1 - m_2)
Используя эту идею, у меня есть следующая реализация, которая дает правильный ответ:
void
Partition::conjugate() {
if (_length == _size) {
this->first();
return;
} else if (_length == 1) {
this->last();
return;
}
std::vector<int> diffs;
diffs.push_back(_parts[_length-1]);
for (size_t i=_length-1; i>0; --i)
diffs.push_back(_parts[i-1]-_parts[i]);
size_t pos = 0;
for (int i=0; i<_length; ++i) {
for (int j = diffs[i]; j>0; --j)
_parts[pos++] = (int)_length - i;
}
_length = pos;
}
Однако он использует другой std-вектор, который я пытаюсь избежать.
В соответствии с ответом Евгения Клюева (принятым ниже), здесь приведен последний код, который работает (см. его ответ для деталей):
void
Partition::conjugate() {
if (_length == _size) {
this->first();
return;
} else if (_length == 1) {
this->last();
return;
}
int last = _parts[_length-1];
for (int i=1; i<_length; ++i)
_parts[_size-i] = _parts[i-1] - _parts[i];
size_t pos = 0;
for (int i=0; i<last; ++i)
_parts[pos++] = (int)_length;
for (int i=1; i<_length; ++i) {
for (int j = _parts[_size-_length+i]; j>0; --j)
_parts[pos++] = (int)_length - i;
}
_length = pos;
}
Ответы
Ответ 1
Это можно сделать в 3 линейных проходах:
- Определите минимальный размер вектора, который позволяет выполнять сопряжение без перекрытия.
- Обратный исходный раздел; поскольку выход, измененный по отношению к входу, допускает меньшее перекрытие и, следовательно, меньшее дополнительное пространство.
- Выполнить сопряжение путем вектора заполнения с соответствующими индексами, повторяющимися столько раз, сколько разница между смежными значениями в исходном разделе.
Вот реализация С++ 11 (см. также полная программа на Ideone).
void conjugate()
{
size_t space = 0;
for (size_t i = 0; i < _length; ++i)
space = max(space, _parts[i] + i);
++space;
_parts.resize(space);
reverse(begin(_parts), end(_parts));
auto it_out = begin(_parts);
auto it_in = end(_parts) - _length;
size_t prev = 0;
for (; it_in < end(_parts); ++it_in)
{
it_out = fill_n(it_out, *it_in - prev, end(_parts) - it_in);
prev = *it_in;
}
_length = it_out - begin(_parts);
_parts.resize(_length);
}
Эта реализация в некотором смысле на месте. Это означает, что он использует один вектор и минимизирует дополнительное пространство, необходимое для сопряжения. В некоторых случаях (например, {4,1,1,1} или {4,3,2,1}) к вектору добавляется только один дополнительный элемент. В сложных случаях (например, {4,4,4,4}) размер вектора временно удваивается.
Можно использовать этот подход, не используя лишнее пространство. Так как "плохие" случаи, такие как {4,4,4,4}, очевидно, имеют очень низкую энтропию, мы могли бы сжать исходный раздел. Однако это усложнит код.
Сочетание RLE и дельта-кодирования делает этот алгоритм действительно на месте (что означает O (1) дополнительное пространство). Используйте положительные числа (или нулевой высокий бит) для кодирования различий между смежными значениями в исходном разделе (поскольку шаг сопряжения в любом случае требует только различий). Используйте отрицательные числа (или ненулевой высокий бит) для кодирования прогонов нуля (оставшиеся биты номера указывают, сколько нулей). Все это ограничивает значение дельта и нулевой счетчик на половину диапазона. Но в обоих случаях может быть не более одного значения, превышающего половину диапазона. Таким образом, мы могли бы просто приписать это негативное значение нулевым (и резервным пространством в векторе не более 2 таких нулей).
Ответ 2
В этом ответе описывается алгоритм, который, возможно, не на месте, из-за его использования знакового бита. Поскольку вы используете подписанный тип, я все равно опубликую его.
Каждый разбиение определяется его максимумами однозначно. Для вашего примера раздела
4 | x
3 | x x x x
2 | x x x x
1 | x x x x x
- - - - -
1 2 3 4 5
где я обозначил оси координатами, а не внутренним представлением разбиения и его транспонированием, максимальные значения (1, 4), (4, 3) и (5, 1).
Первым/последним шагом алгоритма является преобразование в и из представления, описывающего максимумы. В общем, у нас есть место только для одной координаты, поэтому мы должны использовать положение в векторе для описания другого. Прямое преобразование просто заменяет все, кроме последнего вхождения каждого числа на 0.
5 4 4 1 -> 5 0 4 1
4 3 3 3 1 -> 4 0 0 3 1
- - - - -
1 2 3 4 5
Оба преобразования вперед и назад легко реализуются.
Средний шаг - сделать транспонирование на этом альтернативном представлении. Сканирование через массив, поиск положительных целых чисел. Когда мы найдем один, скажем x
в позиции y
, напишите a 0
в положение y
и напишите -y
в положение x
. На самом деле жизнь немного сложнее, чем это; если позиция x
содержит положительное целое число, тогда нам нужно сохранить его во временном порядке, а затем обработать его дальше. Наконец, сканирование через массив, заменяющий -x
на x
(очевидно, это не обязательно должен быть отдельный шаг). Итак, мы выполняем перестановку и имеем немного, чтобы помнить, перемещен ли какой-то конкретный элемент.
Ответ 3
input array in[] = [1,4,4,5]
, предположим in[i]>=i+1
(если это не так, добавьте x к каждому элементу).
то положим out[] = [1,4,4,5,0]
(out[i]=in[i]
);
мы сканируем out[]
с конца и найдем первый элемент none-zero, сохраним его как p
, а p
означает, мы проанализируем out[p]
.
Укажите количество элементов, и мы получим результат.
[1,4,4,5,0] , p = 3, cnt = 1 (parse out[3] = 5)
->
[1,4,4,5,1] , p = 2, cnt = 3 (parse 4)
->
[1,3,3,3,1] , p = 0, cnt = 3 (parse 1)
->
[4,3,3,3,1] , p = -1, cnt = 4 (done)
когда мы анализируем out[i]
(то есть in[i]
), мы будем присваивать next_parse_element ~last_element_assigned-1
, по нашему предположению, it next_element_index + 1~last element assigned-1
, но next_element_index + 1~last element assigned
анализируется нашей программой и бесполезно.
Пример ([1,4,4,5]): при анализе 4
следующий элемент 1
, поэтому мы должны вычислить out[1](next parse element) ~ out[3](last_assigned - 1)
. Но вы видите, что out[1] - out[3]
бесполезен, и мы не теряем никакой информации.
Если это не соответствует предположению, мы можем добавить x к каждому элементу (in[i]+=x
), чтобы соответствовать предположению (самое большее добавить размер in
, еще O(n)
пробел). Затем мы делаем это как вышеописанный метод и игнорируем элементы x
в начале out[]
, и это реальный ответ для ввода.
add 1 to every element in int[]
4 | x x
3 | x x x x x
2 | x x x x x
1 | x x x x x x
- - - - - -
1 2 3 4 5 6
It [4,4,3,3,3,1]
, игнорировать первый элемент и это реальный ответ.
Сложность времени. Если in[]
не сортируется, то это O(nlogn)
, или O(n)
.
Подробнее см. мой код:
import java.util.Arrays;
public class Conjugate {
int[] part;
public Conjugate(int[] array) {
Arrays.sort(array);
int max = 0;
for (int i = 0; i < array.length; i++)
{
max = Math.max(max, array[i]);
}
part = new int[Math.max(max,array.length)];
for (int i = 0;i < array.length; i++)
{
part[i] = array[i];
}
int cnt = 0, p = part.length - 1, next = 0;
for (int i = array.length-1; i >= 0; i--)
{
for (int j = i; j>=0&&part[i]==part[j]; j--)
{
cnt ++;
if (j - 1 < 0)
next = 0;
else
next = part[j-1];
i=j;
}
for (int j = p; j >= next ; j--)
{
part[j] = cnt;
}
p = next - 1 ;
}
}
void output()
{
for (int i = 0; i < part.length; i++)
{
System.out.print(part[i] + " ");
}
}
public static void main(String[] args) {
int[] a = {1,4,4,5};
Conjugate con = new Conjugate(a);
con.output();
}
}