Загрузить все сообщения из группы Google
Я занимаюсь разработкой системы миграции/архивирования приложений Google, и на этом этапе разработки я пытаюсь найти способ загрузки всех сообщений во все группы, созданные пользователями моего домена. Я знаю, что я могу настроить фильтры пересылки и иметь все сообщения, архивированные по электронной почте, но это не помогает в отношении старых сообщений.
Есть ли способ загрузить эти сообщения из группы Google, и если да, есть ли в API администратора список всех групп, которые создали пользователи?
Ответы
Ответ 1
Если вы не возражаете против использования #bash, вы можете попробовать инструмент, который я написал
https://github.com/icy/google-group-crawler
Он может загрузить все файлы mbox из группы Google. Если у вас есть файл cookie, вы можете даже загрузить все файлы из частной группы Google и/или просмотреть все оригинальные электронные письма. Он также может читать RSS-каналы и получать последние сообщения; и это полезно для ежедневного зеркала.
Пример результата приведен здесь http://l.archlinuxvn.org/archlinuxvn/. MHonArch используется для преобразования файлов mbox
в формат HTML.
Ответ 2
В конечном итоге я закончил использование библиотеки python gdata, чтобы получить список всех групп вместе с их соответствующими URL-адресами. Оттуда я использовал селен, чтобы очистить группы от сообщений и всех ответов. Наверное, это не лучшее решение, но оно работает для того, что мне нужно.
Ответ 3
Я сделал простую утилиту утилизации, используя селен и htmlunit..
вы можете использовать его.. он не очень оптимизирован и может помочь вам загружать сообщения только небольших групп (до 7000 сообщений)
https://github.com/himukr/google-grp-scraper
Ответ 4
Я отправил запрос на добавление функции, отметьте его, чтобы увеличить рейтинг приоритетов: https://issuetracker.google.com/issues/130542359