Как объединить несколько потоков голосового звука из DatagramPackets?

Я работаю над проектом, где мне нравится добавлять функциональность push-to-talk, и у меня есть android как клиенты и java как мой сервер. Что я делаю, это отправлять bytes с AudioRecord на мой сервер и передавать их обратно подключенным клиентам.

В чем моя проблема заключается в смешении data от разных клиентов, которые были отправлены одновременно.

Это то, что я пробовал на своем сервере:

static boolean status = true;
static int port = 1938;
static byte[] mixed_audio;
static byte[][] all_bytes;
static int client_count = 0;
static DatagramSocket socket;
static ArrayList<InetAddress> addresses;
public static void main(String args[]) throws Exception {

    DatagramSocket serverSocket = new DatagramSocket(port);    
    System.out.println("Listening. . .");    
    addresses = new ArrayList<>();

    for(int x = 0; x < args.length; x++){
        if(args[x].equals("-p")){
            port = Integer.parseInt(args[x+1]);
        }
    }

    byte[] receiveData = new byte[1400];

    DatagramPacket receivePacket = new DatagramPacket(receiveData,
            receiveData.length);

    socket = new DatagramSocket();

    while (status == true) {
        all_bytes = new byte[1400][1400];
        mixed_audio = new byte[1400];
        serverSocket.receive(receivePacket);        
        int a = addresses.indexOf(receivePacket.getAddress());
        if(a < 0 ){
            addresses.add(receivePacket.getAddress());            
        }
        client_count++;        
        all_bytes[client_count] = receivePacket.getData();
       new Thread(new ReceiveData(receivePacket.getData(), receivePacket.getAddress())).start();

    }
}

public static class ReceiveData implements Runnable{

    byte[] data;
    InetAddress address;

    public ReceiveData(byte[]  b, InetAddress address){
        this.data = b;
        this.address = address;
    }

    @Override
    public void run() {

        try {
            for(int i = 0; i < 1400; i++){
                for(int j = 0; j < 1400; j++){
                    mixed_audio[j] += all_bytes[i][j];
                }
            } 

            if(client_count > 1){
                int c=0;
                for(int x = 0; x < 1400; x++){
                    mixed_audio[x]  = (byte) (mixed_audio[x] / client_count + 1);
                }
            }else{
                mixed_audio = data;
            }
            client_count--;

            for(InetAddress add: addresses){

                if(add != address){
                    DatagramPacket packet;
                    packet = new DatagramPacket(mixed_audio, mixed_audio.length, add, port);
                    socket.send(packet);

                }

            }


        } catch (IOException ex) {
            //Logger.getLogger(TeraMix.class.getName()).log(Level.SEVERE, null, ex);
        }

    }

}

Аудиовыход, когда разговаривает только один клиент, ясен, но аудиовыход, когда несколько клиентов начинают говорить одновременно, становится очень неясным.

Я также попробовал свой алгоритм для смешивания звука, используя его в файлах на моем ПК, и он работал хорошо. Мне нужно смешивать data packets, которые одновременно отправляются разными клиентами.

Нужно ли мне обрабатывать клиентов на разных потоках? Я делаю это неправильно? есть ли лучший способ? пожалуйста, помогите мне по этому поводу. Спасибо!

Ответы

Ответ 1

Я не знаю, удалось ли вам отлаживать, как пакеты там объединяются, но из чтения я бы сказал, что проблема в том, что каждый полученный пакет порождает собственный поток, который затем отправляет текущий объединенный пакет.

Например, если три клиента A, B и C, отправляя пакеты 1 и 2, слияния будут:

  • A1 in → A1 out
  • B1 in → B1, или, возможно, A1 + B1 out
  • C1 in → C1 или B1 + C1 или даже A1 + B1 + C1 out
  • A2 in → A2 или C1 + A2 или...
  • B2 в → B2 или A2 + B2 или...
  • C2 in → C2 или B2 + C2 или...

В этом упрощенном случае он отправил бы шесть пакетов вместо идеального двух - A1 + B1 + C1 и A2 + B2 + B2?

Ясно, что это немного позаботится о том, чтобы слияние было гладким, особенно, поскольку я уверен, что пакеты не будут полностью синхронизированы - это UDP в конце концов.

Предполагая, что это нормально для работы с "слиянием каких у вас пакетов", может работать только запуск потока отправки, когда у вас уже есть пакеты для всех текущих клиентов или если второй пакет поступает на одного из клиентов или, возможно, после таймаута по частоте выборки.

Я предполагаю, что это может привести к конфликту над all_bytes между all_bytes приема и отправки. Лучше было бы передать текущие all_bytes до ReceiveData ReceiveData, как только будет достаточно пакетов, но затем запустите новый, чтобы прочитать больше пакетов. Или, по крайней мере, цикл массивов, если проблема с памятью /GC может быть проблемой.