Что означает сравнение, сопоставимое с равными? Что может случиться, если мой класс не соблюдает этот принцип?

Из JavaDoc TreeMap:

Обратите внимание, что упорядочение, поддерживаемое сортированной картой (независимо от того, явный компаратор) должен быть согласован с равными, если эта сортированная карта - это правильно реализовать интерфейс карты. (Видеть Сравнительный или компаратор для точного определения, согласующегося с равно). Это связано с тем, что интерфейс Map определяется в терминах операция равенства, но карта выполняет все ключевые сравнения, используя compareTo (или compare), поэтому два ключа, которые считаются равными этот метод, с точки зрения сортированной карты, равен. поведение сортированной карты хорошо определено, даже если ее упорядочение несовместим с равными; он просто не подчиняется генеральному контракту интерфейса карты.

Может ли кто-нибудь дать конкретный пример для демонстрации проблемы, которая может возникнуть, если упорядочение не соответствует равным? Возьмем, например, пользовательский класс, который имеет естественный порядок, т.е. Реализует Comparable. Также все внутренние классы в JDK поддерживают этот инвариант?

Ответы

Ответ 1

Контракт интерфейса Comparable допускает несовместимое поведение:

Настоятельно рекомендуется (хотя и не обязательно), чтобы естественные порядки были согласованы с равными.

Таким образом, теоретически возможно, что класс в JDK имел compareTo, не соответствующий equals. Хорошим примером является BigDecimal.

Ниже приведен надуманный пример компаратора, который не согласуется с равными (в основном он говорит, что все строки равны).

Вывод:

размер: 1
content: {a = b}

public static void main(String[] args) {
    Map<String, String> brokenMap = new TreeMap<String, String> (new Comparator<String>() {

        @Override
        public int compare(String o1, String o2) {
            return 0;
        }
    });

    brokenMap.put("a", "a");
    brokenMap.put("b", "b");
    System.out.println("size: " + brokenMap.size());
    System.out.println("content: " + brokenMap);
}

Ответ 2

Скажем, у нас есть этот простой класс Student, реализующий Comparable<Student>, но не переопределяющий equals()/hashCode(). Конечно, equals() не согласуется с compareTo() - два разных ученика с одинаковыми age не равны:

class Student implements Comparable<Student> {

    private final int age;

    Student(int age) {
        this.age = age;
    }

    @Override
    public int compareTo(Student o) {
        return this.age - o.age;
    }

    @Override
    public String toString() {
        return "Student(" + age + ")";
    }
}

Мы можем безопасно использовать его в TreeMap<Student, String>:

Map<Student, String> students = new TreeMap<Student, String>();
students.put(new Student(25), "twenty five");
students.put(new Student(22), "twenty two");
students.put(new Student(26), "twenty six");
for (Map.Entry<Student, String> entry : students.entrySet()) {
    System.out.println(entry);
}
System.out.println(students.get(new Student(22)));

Результаты легко предсказать: ученики хорошо сортируются в соответствии с их возрастом (несмотря на то, что они вставлены в другом порядке), и выбор ученика, использующего ключ new Student(22), также работает и возвращает "twenty two". Это означает, что мы можем безопасно использовать класс Student в TreeMap.

Однако измените students на HashMap, и все будет плохо:

Map<Student, String> students = new HashMap<Student, String>();

Очевидно, что перечисление элементов возвращает "случайный" порядок из-за хэширования - этот штраф, он не нарушает ни одного контракта Map. Но последнее утверждение полностью нарушено. Поскольку HashMap использует equals()/hashCode() для сравнения экземпляров, извлечение значения с помощью ключа new Student(22) завершается с ошибкой и возвращает null!

Это то, что пытается объяснить JavaDoc: такие классы будут работать с TreeMap, но могут не работать с другими реализациями Map. Обратите внимание, что операции Map документируются и определяются в терминах equals()/hashCode(), например. containsKey():

[...] возвращает true тогда и только тогда, когда эта карта содержит отображение для ключа k такое, что (key==null ? k==null : key.equals(k))

Таким образом, я не считаю, что существуют стандартные классы JDK, которые реализуют Comparable, но не реализуют пару equals()/hashCode().

Ответ 3

Вот еще один пример того, насколько важна согласованность с равными И общим порядком.

Скажем, у нас есть объект MyObject, который имеет два поля: id и quantity. id, как следует из его названия, является естественным ключом объекта, а quantity является только атрибутом.

public class MyObject {
  int id;
  int quantity;
  ...
}

Предположим, что мы хотим использовать коллекции MyObject, отсортированные по quantity по убыванию. Первым компаратором, который мы можем записать, является:

Comparator<MyObject> naiveComp = new Comparator<MyObject>() {
  @Override
  public int compare(MyObject o1, MyObject o2) {
    return o2.quantity - o1.quantity;
  }
};

Использование экземпляров MyObject, оснащенных этим компаратором в TreeMap/TreeSet, терпит неудачу, потому что компаратор не соответствует равным (см. полный код ниже). Пусть он согласуется с равенствами:

Comparator<MyObject> slightlyBetterComp = new Comparator<MyObject>() {
  @Override
  public int compare(MyObject o1, MyObject o2) {
    if (o1.equals(o2)) {
      return 0;
    }
    if (o1.quantity == o2.quantity) {
      return -1; // never 0
    }
    return o2.quantity - o1.quantity; // never 0
  }
};

Однако это снова не вписывается в TreeSet/TreeMap! (см. полный код ниже) Это связано с тем, что отношение упорядочения не total, т.е. Никакие два объекта не могут быть строго привязаны к отношениям упорядочения. В этом компараторе, когда поля quantity равны, результирующий порядок не определен.

Лучшим компаратором будет:

Comparator<MyObject> betterComp = new Comparator<MyObject>() {
  @Override
  public int compare(MyObject o1, MyObject o2) {
    if (o1.equals(o2)) {
      return 0;
    }
    if (o1.quantity == o2.quantity) {
      return o1.id - o2.id; // never 0
    }
    return o2.quantity - o1.quantity; // never 0
  }
};

Этот компаратор обеспечивает:

  • когда compareTo возвращает 0, это означает, что два объекта: equal (начальная проверка для равенства)
  • все элементы полностью упорядочены, используя id в качестве поля дискриминантного упорядочения, когда quantity равны

Полный тестовый код:

package treemap;

import java.util.Comparator;
import java.util.HashMap;
import java.util.Map;
import java.util.TreeMap;

public class MyObject {
  int id;
  int quantity;

  public MyObject(int id, int quantity) {
    this.id = id;
    this.quantity = quantity;
  }

  @Override
  public int hashCode() {
    int hash = 7;
    hash = 97 * hash + this.id;
    return hash;
  }

  @Override
  public boolean equals(Object obj) {
    if (obj == null) {
      return false;
    }
    if (getClass() != obj.getClass()) {
      return false;
    }
    final MyObject other = (MyObject) obj;
    if (this.id != other.id) {
      return false;
    }
    return true;
  }

  @Override
  public String toString() {
    return "{" + id + ", " + quantity + "}";
  }

  public static void main(String[] args) {
    String format = "%30.30s: %s\n";
    Map<MyObject, Object> map = new HashMap();
    map.put(new MyObject(1, 100), 0);
    map.put(new MyObject(2, 100), 0);
    map.put(new MyObject(3, 200), 0);
    map.put(new MyObject(4, 100), 0);
    map.put(new MyObject(5, 500), 0);
    System.out.printf(format, "Random Order", map.keySet());

    // Naive non-consisten-with-equal and non-total comparator
    Comparator<MyObject> naiveComp = new Comparator<MyObject>() {
      @Override
      public int compare(MyObject o1, MyObject o2) {
        return o2.quantity - o1.quantity;
      }
    };
    Map<MyObject, Object> badMap = new TreeMap(naiveComp);
    badMap.putAll(map);
    System.out.printf(format, "Non Consistent and Non Total", badMap.keySet());

    // Better consisten-with-equal but non-total comparator
    Comparator<MyObject> slightlyBetterComp = new Comparator<MyObject>() {
      @Override
      public int compare(MyObject o1, MyObject o2) {
        if (o1.equals(o2)) {
          return 0;
        }
        if (o1.quantity == o2.quantity) {
          return -1; // never 0
        }
        return o2.quantity - o1.quantity; // never 0
      }
    };
    Map<MyObject, Object> slightlyBetterMap = new TreeMap(naiveComp);
    slightlyBetterMap.putAll(map);
    System.out.printf(format, "Non Consistent but Total", slightlyBetterMap.keySet());

    // Consistent with equal AND total comparator
    Comparator<MyObject> betterComp = new Comparator<MyObject>() {
      @Override
      public int compare(MyObject o1, MyObject o2) {
        if (o1.equals(o2)) {
          return 0;
        }
        if (o1.quantity == o2.quantity) {
          return o1.id - o2.id; // never 0
        }
        return o2.quantity - o1.quantity; // never 0
      }
    };
    Map<MyObject, Object> betterMap = new TreeMap(betterComp);
    betterMap.putAll(map);
    System.out.printf(format, "Consistent and Total", betterMap.keySet());
  }
}

Вывод:

                  Random Order: [{5, 500}, {4, 100}, {3, 200}, {2, 100}, {1, 100}]
  Non Consistent and Non Total: [{5, 500}, {3, 200}, {4, 100}]
      Consistent but Not Total: [{5, 500}, {3, 200}, {4, 100}]
          Consistent and Total: [{5, 500}, {3, 200}, {1, 100}, {2, 100}, {4, 100}]

Вывод:

Хотя я считаю, что вполне законно отделять идентичность от упорядочения концептуально. Например, в терминах реляционных баз данных:

select * from MyObjects order by quantity

работает отлично. Мы не заботимся об идентичности объекта здесь, и мы не хотим, чтобы общее упорядочение

Однако из-за ограничений в реализации коллекций на основе дерева необходимо убедиться, что любой компаратор, который они пишут:

  • является согласованностью с равными
  • обеспечивает общий порядок над всеми возможными объектами