Какой поток Java забивает процессор?
Скажем, ваша Java-программа принимает 100% -ный процессор. Он имеет 50 потоков. Вам нужно найти, какая нить виновна. Я не нашел инструмент, который может помочь. В настоящее время я использую следующую очень трудоемкую процедуру:
- Запустите
jstack <pid>
, где pid - это идентификатор процесса Java-процесса. Легкий способ найти это - запустить еще одну утилиту, включенную в JDK - jps
. Лучше перенаправить jstack-вывод в файл.
- Поиск "runnable" потоков. Пропустите те, которые ждут сокета (по какой-то причине они по-прежнему помечены как runnable).
- Повторите шаги 1 и 2 пару раз и посмотрите, можете ли вы найти шаблон.
В качестве альтернативы вы можете подключиться к процессу Java в Eclipse и попытаться приостановить потоки один за другим, пока не нажмете тот, который запускает CPU. На машине с одним процессором вам может потребоваться сначала снизить приоритет процесса Java, чтобы иметь возможность передвигаться. Даже тогда Eclipse часто не может подключиться к запущенному процессу из-за таймаута.
Я бы ожидал использования инструмента Sun visualvm
.
Знает ли кто-нибудь лучший способ?
Ответы
Ответ 1
Попробуйте посмотреть плагин Hot Thread Detector для визуальной виртуальной машины - он использует API ThreadMXBean для выполнения нескольких выборок потребления процессора, чтобы найти наиболее активные потоки. Он основан на эквиваленте командной строки от Bruce Chapman, который также может быть полезен.
Ответ 2
Определение того, какой поток Java потребляет большинство процессоров на рабочем сервере.
Большинство (если не все) производительных систем, делающих что-либо важное, будут использовать более 1 потока java. И когда что-то сходит с ума, а использование вашего процессора на 100%, трудно определить, какой поток (-ы) это/вызывает это. Или так я думал. Пока кто-то умнее меня не показал мне, как это можно сделать. И здесь я покажу вам, как это сделать, и вы тоже можете поразить своих родных и друзей своими навыками выживания.
Приложение для тестирования
Чтобы проверить это, нам нужно тестовое приложение. Поэтому я дам вам один. Он состоит из 3 классов:
- Класс
HeavyThread
, который делает что-то интенсивное CPU (вычисление хэшей MD5)
- A
LightThread
класс, который делает что-то не так-cpu-интенсивное (подсчет и сон).
- Класс
StartThreads
, чтобы начать интенсивность 1 процессор и несколько световых потоков.
Вот код для этих классов:
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.UUID;
/**
* thread that does some heavy lifting
*
* @author srasul
*
*/
public class HeavyThread implements Runnable {
private long length;
public HeavyThread(long length) {
this.length = length;
new Thread(this).start();
}
@Override
public void run() {
while (true) {
String data = "";
// make some stuff up
for (int i = 0; i < length; i++) {
data += UUID.randomUUID().toString();
}
MessageDigest digest;
try {
digest = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
throw new RuntimeException(e);
}
// hash the data
digest.update(data.getBytes());
}
}
}
import java.util.Random;
/**
* thread that does little work. just count & sleep
*
* @author srasul
*
*/
public class LightThread implements Runnable {
public LightThread() {
new Thread(this).start();
}
@Override
public void run() {
Long l = 0l;
while(true) {
l++;
try {
Thread.sleep(new Random().nextInt(10));
} catch (InterruptedException e) {
e.printStackTrace();
}
if(l == Long.MAX_VALUE) {
l = 0l;
}
}
}
}
/**
* start it all
*
* @author srasul
*
*/
public class StartThreads {
public static void main(String[] args) {
// lets start 1 heavy ...
new HeavyThread(1000);
// ... and 3 light threads
new LightThread();
new LightThread();
new LightThread();
}
}
Предполагая, что вы никогда не видели этот код, и все, что у вас есть ПИД-код бегущего Java-процесса, который запускает эти классы и потребляет 100% -ный процессор.
Сначала запустите класс StartThreads
.
$ ls
HeavyThread.java LightThread.java StartThreads.java
$ javac *
$ java StartThreads &
На этом этапе процесс Java должен работать на 100 процессоров. В моей верхней части я вижу:
![screenshot of top output]()
В верхнем прессе нажмите Shift-H, который включает нитки. Страница руководства для верхнего уровня:
-H : Threads toggle
Starts top with the last remembered 'H' state reversed. When
this toggle is On, all individual threads will be displayed.
Otherwise, top displays a summation of all threads in a
process.
И теперь в моей верхней части с включенным дисплеем Threads я вижу:
![top screenshot with threads displayed]()
И у меня есть процесс java
с PID 28294
. Позволяет получить дамп стека этого процесса с помощью jstack
:
$ jstack 28924
2010-11-18 13:05:41
Full thread dump Java HotSpot(TM) 64-Bit Server VM (17.0-b16 mixed mode):
"Attach Listener" daemon prio=10 tid=0x0000000040ecb000 nid=0x7150 waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"DestroyJavaVM" prio=10 tid=0x00007f9a98027800 nid=0x70fd waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"Thread-3" prio=10 tid=0x00007f9a98025800 nid=0x710d waiting on condition [0x00007f9a9d543000]
java.lang.Thread.State: TIMED_WAITING (sleeping)
at java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.java:21)
at java.lang.Thread.run(Thread.java:619)
"Thread-2" prio=10 tid=0x00007f9a98023800 nid=0x710c waiting on condition [0x00007f9a9d644000]
java.lang.Thread.State: TIMED_WAITING (sleeping)
at java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.java:21)
at java.lang.Thread.run(Thread.java:619)
"Thread-1" prio=10 tid=0x00007f9a98021800 nid=0x710b waiting on condition [0x00007f9a9d745000]
java.lang.Thread.State: TIMED_WAITING (sleeping)
at java.lang.Thread.sleep(Native Method)
at LightThread.run(LightThread.java:21)
at java.lang.Thread.run(Thread.java:619)
"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
java.lang.Thread.State: RUNNABLE
at sun.security.provider.DigestBase.engineReset(DigestBase.java:139)
at sun.security.provider.DigestBase.engineUpdate(DigestBase.java:104)
at java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.java:538)
at java.security.MessageDigest.update(MessageDigest.java:293)
at sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.java:197)
- locked <0x00007f9aa457e400> (a sun.security.provider.SecureRandom)
at sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.java:257)
- locked <0x00007f9aa457e708> (a java.lang.Object)
at sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.java:108)
at sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.java:97)
at java.security.SecureRandom.nextBytes(SecureRandom.java:433)
- locked <0x00007f9aa4582fc8> (a java.security.SecureRandom)
at java.util.UUID.randomUUID(UUID.java:162)
at HeavyThread.run(HeavyThread.java:27)
at java.lang.Thread.run(Thread.java:619)
"Low Memory Detector" daemon prio=10 tid=0x00007f9a98006800 nid=0x7108 runnable [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"CompilerThread1" daemon prio=10 tid=0x00007f9a98004000 nid=0x7107 waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"CompilerThread0" daemon prio=10 tid=0x00007f9a98001000 nid=0x7106 waiting on condition [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"Signal Dispatcher" daemon prio=10 tid=0x0000000040de4000 nid=0x7105 runnable [0x0000000000000000]
java.lang.Thread.State: RUNNABLE
"Finalizer" daemon prio=10 tid=0x0000000040dc4800 nid=0x7104 in Object.wait() [0x00007f9a97ffe000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x00007f9aa45506b0> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118)
- locked <0x00007f9aa45506b0> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:134)
at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:159)
"Reference Handler" daemon prio=10 tid=0x0000000040dbd000 nid=0x7103 in Object.wait() [0x00007f9a9de92000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x00007f9aa4550318> (a java.lang.ref.Reference$Lock)
at java.lang.Object.wait(Object.java:485)
at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:116)
- locked <0x00007f9aa4550318> (a java.lang.ref.Reference$Lock)
"VM Thread" prio=10 tid=0x0000000040db8800 nid=0x7102 runnable
"GC task thread#0 (ParallelGC)" prio=10 tid=0x0000000040d6e800 nid=0x70fe runnable
"GC task thread#1 (ParallelGC)" prio=10 tid=0x0000000040d70800 nid=0x70ff runnable
"GC task thread#2 (ParallelGC)" prio=10 tid=0x0000000040d72000 nid=0x7100 runnable
"GC task thread#3 (ParallelGC)" prio=10 tid=0x0000000040d74000 nid=0x7101 runnable
"VM Periodic Task Thread" prio=10 tid=0x00007f9a98011800 nid=0x7109 waiting on condition
JNI global references: 910
Из моего верха я вижу, что PID верхнего потока 28938
. И 28938
в шестнадцатеричном формате 0x710A
. Обратите внимание, что в дампе стека каждый поток имеет nid
, который отображается в шестнадцатеричном виде. И так получилось, что 0x710A
является идентификатором потока:
"Thread-0" prio=10 tid=0x00007f9a98020000 nid=0x710a runnable [0x00007f9a9d846000]
java.lang.Thread.State: RUNNABLE
at sun.security.provider.DigestBase.engineReset(DigestBase.java:139)
at sun.security.provider.DigestBase.engineUpdate(DigestBase.java:104)
at java.security.MessageDigest$Delegate.engineUpdate(MessageDigest.java:538)
at java.security.MessageDigest.update(MessageDigest.java:293)
at sun.security.provider.SecureRandom.engineNextBytes(SecureRandom.java:197)
- locked <0x00007f9aa457e400> (a sun.security.provider.SecureRandom)
at sun.security.provider.NativePRNG$RandomIO.implNextBytes(NativePRNG.java:257)
- locked <0x00007f9aa457e708> (a java.lang.Object)
at sun.security.provider.NativePRNG$RandomIO.access$200(NativePRNG.java:108)
at sun.security.provider.NativePRNG.engineNextBytes(NativePRNG.java:97)
at java.security.SecureRandom.nextBytes(SecureRandom.java:433)
- locked <0x00007f9aa4582fc8> (a java.security.SecureRandom)
at java.util.UUID.randomUUID(UUID.java:162)
at HeavyThread.run(HeavyThread.java:27)
at java.lang.Thread.run(Thread.java:619)
Итак, вы можете подтвердить, что поток, который запускает класс HeavyThread
, потребляет большинство CPU.
В условиях чтения в мире это, вероятно, будет куча потоков, которые потребляют часть процессора, и эти потоки, собранные вместе, приведут к процессу Java с использованием 100% CPU.
Резюме
- Run top
- Нажмите Shift-H, чтобы включить просмотр потоков
- Получить PID потока с самым высоким процессором
- Преобразование PID в HEX
- Получение дампа в java-процессе
- Посмотрите на поток с соответствующим HEX PID.
Ответ 3
jvmtop может показать вам наиболее популярные темы:
TID NAME STATE CPU TOTALCPU
25 http-8080-Processor13 RUNNABLE 4.55% 1.60%
128022 RMI TCP Connection(18)-10.101. RUNNABLE 1.82% 0.02%
36578 http-8080-Processor164 RUNNABLE 0.91% 2.35%
128026 JMX server connection timeout TIMED_WAITING 0.00% 0.00%
Ответ 4
Просто запустите JVisualVM, подключитесь к своему приложению и используйте представление потока. Тот, который остается постоянно активным, является вашим наиболее вероятным виновником.
Ответ 5
Посмотрите на плагин Top Threads для JConsole.
Ответ 6
Если вы работаете под Windows, попробуйте Process Explorer. Подготовьте диалоговое окно свойств для своего процесса, затем выберите вкладку "Темы".
Ответ 7
Возьмите дамп потока. Подождите 10 секунд. Возьмите еще одну свалку. Повторите еще раз.
Осмотрите дампы потоков и посмотрите, какие потоки застревают в одном месте или обрабатывают один и тот же запрос.
Это ручной способ сделать это, но часто полезно.
Ответ 8
Вы используете Java 6 на многоядерном компьютере?
Скорее всего, вы страдаете от проблемы, которую я только что описал в статье о голодном голоде.
См. Синхронизированный против блокировки против честного блокировки.
Ответ 9
Это своего рода хакерский способ, но похоже, что вы можете запустить приложение в отладчике, а затем приостановить все потоки и пройти через код и узнать, какой из них не блокирует блокировку или вызов ввода-вывода в каком-то цикле. Или это похоже на то, что вы уже пробовали?
Ответ 10
Вы можете рассмотреть возможность запроса ваших потоков для ответа из приложения. С помощью ThreadMXBean вы можете запросить использование процессора потоками из вашего приложения Java и отслеживать стеки запросов о нарушении (-ов) потоков.
Опция ThreadMXBean позволяет создавать такой мониторинг в вашем реальном приложении. Это оказывает незначительное влияние и имеет явное преимущество, что вы можете сделать это именно так, как хотите.
Ответ 11
Если вы подозреваете, что VisualVM - хороший инструмент, попробуйте его (потому что он это делает). Выясните, что нити помогают вам в общем направлении, почему он потребляет столько CPU.
Однако, если это очевидно, я бы сразу пошел к использованию профилировщика, чтобы узнать, почему вы потребляете столько CPU.