Загрузить все сообщения из группы Google

Я занимаюсь разработкой системы миграции/архивирования приложений Google, и на этом этапе разработки я пытаюсь найти способ загрузки всех сообщений во все группы, созданные пользователями моего домена. Я знаю, что я могу настроить фильтры пересылки и иметь все сообщения, архивированные по электронной почте, но это не помогает в отношении старых сообщений.

Есть ли способ загрузить эти сообщения из группы Google, и если да, есть ли в API администратора список всех групп, которые создали пользователи?

Ответы

Ответ 1

Если вы не возражаете против использования #bash, вы можете попробовать инструмент, который я написал

https://github.com/icy/google-group-crawler

Он может загрузить все файлы mbox из группы Google. Если у вас есть файл cookie, вы можете даже загрузить все файлы из частной группы Google и/или просмотреть все оригинальные электронные письма. Он также может читать RSS-каналы и получать последние сообщения; и это полезно для ежедневного зеркала.

Пример результата приведен здесь http://l.archlinuxvn.org/archlinuxvn/. MHonArch используется для преобразования файлов mbox в формат HTML.

Ответ 2

В конечном итоге я закончил использование библиотеки python gdata, чтобы получить список всех групп вместе с их соответствующими URL-адресами. Оттуда я использовал селен, чтобы очистить группы от сообщений и всех ответов. Наверное, это не лучшее решение, но оно работает для того, что мне нужно.

Ответ 3

Я сделал простую утилиту утилизации, используя селен и htmlunit.. вы можете использовать его.. он не очень оптимизирован и может помочь вам загружать сообщения только небольших групп (до 7000 сообщений)

https://github.com/himukr/google-grp-scraper