Как эффективно генерировать комбинацию без повторения с определенным отличительным числом между ними
Как эффективно генерировать наборы комбинаций без повторения, где все множества имеют определенное отличительное число между собой.
* ПРИМЕЧАНИЕ: Номер диапазона всегда начинается с 0.
Пример:
Номер диапазона (числа [])= 0,1,2,3,4,5,6,7 == > всего 8 чисел (n).
Комбинация (k)= 5 чисел.
Отличительные номера (nD)= 2 числа.
Результаты:
0 1 2 3 4
0 1 2 5 6
0 1 3 5 7
0 1 4 6 7
0 2 3 6 7
0 2 4 5 7
0 3 4 5 6
Есть 7 допустимых комбинаций
Как он собран:
Так как я плохо разбираюсь в словах, поэтому позвольте мне визуализировать их так:
![введите описание изображения здесь]()
Чтобы объяснить их отличительные числа:
![введите описание изображения здесь]()
И мы могли бы суммировать их в этой таблице:
![введите описание изображения здесь]()
Что я до сих пор добился
Мое текущее решение очень неэффективно (или вы можете называть его грубой силой).
* Первый цикл я для каждой комбинации. == > k C n
* Затем я создаю temp для действительной комбинации.
* Затем для каждой комбинации я проверяю на мой темп, если его действительный, то сохраните его в temp, иначе проигнорируйте его.
Вот оно.
Вот мой код в приложении консоли:
class Program
{
static List<int[]> ValidCombinations;
static void Main()
{
ValidCombinations = new List<int[]>();
int[] numbers = Enumerable.Range(0, 8).ToArray();
int n = numbers.Length;
const int k = 5;
const int nD = 2;
int maxIntersect = k - nD;
int iCombination = 0;
int iValidCombination = 0;
int[] _temp = new int[k];
foreach (int[] c in FindCombinations(k, n))
{
// #Print out
for (int i = 0; i < n; i++)
{
if (c.Contains(i))
Console.Write(c[Array.IndexOf(c, i)] + " ");
else
Console.Write("_ ");
}
// Save to List
if (IsValidSet(c, maxIntersect))
{
_temp = new int[k];
for (int i = 0; i < c.Length; i++)
{
_temp[i] = c[i];
}
ValidCombinations.Add(_temp);
iValidCombination++;
Console.Write(" ### --> {0}", string.Join(" ", c));
}
Console.WriteLine();
iCombination++;
}
Console.WriteLine("\nTotal Combination = {0}", iCombination);
Console.WriteLine("Valid Combination Found = {0}", iValidCombination);
}
public static IEnumerable<int[]> FindCombosRec(int[] buffer, int done, int begin, int end)
{
for (int i = begin; i < end; i++)
{
buffer[done] = i;
if (done == buffer.Length - 1)
yield return buffer;
else
foreach (int[] child in FindCombosRec(buffer, done + 1, i + 1, end))
yield return child;
}
}
public static IEnumerable<int[]> FindCombinations(int m, int n)
{
return FindCombosRec(new int[m], 0, 0, n);
}
private static bool IsValidSet(int[] set, int maxIntersect)
{
foreach (var item in ValidCombinations)
{
if (set.Intersect(item).Count() > maxIntersect)
return false;
}
return true;
}
}
Я получил базовый код для создания комбинации здесь.
Проблемы
Это работа, но для большего диапазона чисел это решение займет много времени. Я знаю, потому что комбинационный алгоритм задействован, но должен быть какой-то ярлык или шаблон, чтобы упростить его (который мой маленький мозг не смог понять).
Большое спасибо.
Ответы
Ответ 1
Ваше матричное представление показывает, что эта проблема гомологична или, по крайней мере, очень похожа на нахождение набора различных двоичных слов фиксированного размера, константа Вес Хэмминга и с константой расстояние Хэмминга между любой их парой.
Графически:
![введите описание изображения здесь]()
Как описано в этом вопросе, эта проблема не обязательно тривиальна. В частности, предлагаемое решение объясняет, как построить матрицу Адамара, строки которой представляют собой бинарные слова, которые вы ищете.
![Изображение взято из http://mathworld.wolfram.com/images/eps-gif/HadamardMatrices_800.gif]()
Это выглядит очень похоже на вашу матрицу. Во всяком случае, вам нужно немного более общее. В отличие от этого случая, вы не хотите, чтобы каждая пара строк имела ровно расстояние n/2
, но постоянное расстояние d < n/2
.
Нижняя строка
Возможность легко генерировать множества двоичных слов с постоянным размером (определяется длиной массива numbers
), постоянным весом (определяемым вашим k
) и постоянным расстоянием (определяется вашим nD
), в значительной степени зависит от эти параметры. Учитывая, что некоторые методы для создания этих наборов полагаются на некоторые предположения по этим параметрам, я предполагаю, что нет эффективного алгоритма для общего случая.
В любом случае, может быть полезно, если вы измените свой вопрос и спросите его на MathOverflow, возможно, связав этот вопрос и тот, который я связал.
Предложение алгоритма
Что касается алгоритма (который, как и ваш, не будет работать с большими числами), вы можете попробовать следующее:
- Создайте двоичное слово, состоящее из
k
, за которым следует (numbers.Length - nD)
нули и сохраните его в списке
- Итеративно генерируйте каждое слово, имеющее ровно
2*nD
бит, отличный от вашего исходного слова.
- Для каждого сгенерированного слова попробуйте сохранить его в списке, только если он имеет
2*nD
расстояние друг от друга в списке.
Не так уж и отличается от вашего подхода, но я думаю, что это могло бы работать немного лучше, ты.
Ответ 2
#include<iostream>
#include<vector>
#define N 8
#define K 5
#define D 2
using namespace std;
vector<vector<int>> vv;
vector<int> v;
int intersection(const vector<int>& a, const vector<int>& b)
{//count elements of intersection of two sorted vectors
int count = 0;
auto a_it = a.begin();
auto b_it = b.begin();
while(a_it != a.end() && b_it != b.end()) {
if(*a_it == *b_it) count++, a_it++, b_it++;
else if(*a_it < *b_it) a_it++;
else b_it++;
}
return count;
}
void select_num(int n)
{//might reduce some unnecessary iteration of nCk combination
for(auto& a : vv) if(intersection(a, v) > K - D) return;
//above line will cut off the chain when the intersection is already over
//limit. You can add some more conditions to cut off unnecessary calculation.
if(v.size() == K) {
bool ok = true;
for(auto& a : vv) {
if(intersection(a, v) != K - D) {
ok = false;
break;
}
}
if(ok) vv.push_back(v);
return;
}
if(n == N) return;
//case : select n
v.push_back(n);
select_num(n+1);
v.pop_back();
//case : do not select n
select_num(n+1);
}
int main()
{
select_num(0);
for(auto& a : vv) {
for(auto& b : a) cout << b << ' ';
cout << endl;
}
cout << endl << vv.size() << endl;
}