done

serejekee · web-flow · commit c9e6ad0837a3 · 2025-05-21T02:18:10.000+09:00
diff --git a/main.py b/main.py
@@ -0,0 +1,95 @@
+import os
+import re
+import email
+from email import policy
+from email.parser import BytesParser
+from email.header import decode_header
+from datetime import datetime
+from bs4 import BeautifulSoup
+from docx import Document
+
+folder_path = "data"
+output_data = []
+
+# Чтение и парсинг писем
+for filename in os.listdir(folder_path):
+    if filename.endswith(".eml"):
+        eml_path = os.path.join(folder_path, filename)
+        with open(eml_path, "rb") as file:
+            msg = BytesParser(policy=policy.default).parse(file)
+
+        date = msg["Date"]
+        from_ = msg["From"]
+        to = msg["To"]
+        subject = msg["Subject"]
+
+        attachment_header = msg["Content-Disposition"]
+        body = msg.get_body(preferencelist=("plain", "html"))
+        body_content = body.get_content() if body else ""
+
+        # Преобразование HTML в текст
+        if body and body.get_content_type() == "text/html":
+            soup = BeautifulSoup(body_content, "html.parser")
+            body_content = soup.get_text()
+
+        # Очистка от лишних пробелов и пустых строк
+        body_content = "\n".join(
+            re.sub(r"\s{2,}", " ", line.strip())
+            for line in body_content.splitlines()
+            if line.strip()
+        )
+
+        # Преобразование даты
+        try:
+            parsed_date = datetime.strptime(date[:-6], "%a, %d %b %Y %H:%M:%S")
+            formatted_date = parsed_date.strftime("%d.%m.%Y %H:%M")
+        except Exception as e:
+            formatted_date = date
+
+        attachments = []
+        for part in msg.iter_attachments():
+            attach_name = part.get_filename()
+            if attach_name:
+                attachments.append(attach_name)
+
+        # Сбор данных
+        output_data.append({
+            "Дата/время": formatted_date,
+            "Отправитель (от кого)": from_,
+            "Получатель (кому)": to,
+            "Содержание письма / Тема": f"Тема: {subject}\n\n{body_content}\n\n",
+            "Названия вложений": ", ".join(attachments) if attachments else " "
+        })
+
+print(f"\nВсего обработано писем: {len(output_data)}")
+
+# Создание Word-файла и таблицы
+doc = Document()
+doc.add_heading('Список писем', 0)
+
+table = doc.add_table(rows=1, cols=5)
+table.style = 'Table Grid'
+
+# Заголовки
+hdr_cells = table.rows[0].cells
+hdr_cells[0].text = 'Дата/время'
+hdr_cells[1].text = 'Отправитель (от кого)'
+hdr_cells[2].text = 'Получатель (кому)'
+hdr_cells[3].text = 'Содержание письма / Тема'
+hdr_cells[4].text = 'Названия вложений'
+
+# Добавление строк
+for i, email_data in enumerate(output_data):
+    row_cells = table.add_row().cells
+    row_cells[0].text = email_data["Дата/время"]
+    row_cells[1].text = email_data["Отправитель (от кого)"]
+    row_cells[2].text = email_data["Получатель (кому)"]
+    row_cells[3].text = email_data["Содержание письма / Тема"]
+    row_cells[4].text = email_data["Названия вложений"]
+
+# Сохранение .docx файла
+doc_path = "emails.docx"
+doc.save(doc_path)
+
+print(f"\nФайл Word с таблицей сохранён: {doc_path}")
+print(f"Обработано {len(output_data)} писем.")
diff --git a/requirements.txt b/requirements.txt
@@ -0,0 +1,3 @@
+pandas
+beautifulsoup4
+python-docx
diff --git a/start.bat b/start.bat
@@ -0,0 +1,43 @@
+@echo off
+setlocal
+
+echo Checking if Python is installed...
+python --version >nul 2>&1
+if %errorlevel% neq 0 (
+    echo Python not found. Downloading and installing Python 3.11...
+    powershell -Command "Invoke-WebRequest -Uri https://www.python.org/ftp/python/3.11.4/python-3.11.4-amd64.exe -OutFile python-installer.exe"
+
+    echo Installing Python in silent mode...
+    python-installer.exe /quiet InstallAllUsers=1 PrependPath=1 Include_test=0
+    if %errorlevel% neq 0 (
+        echo Error during Python installation.
+        pause
+        exit /b 1
+    )
+    echo Deleting installer file...
+    del python-installer.exe
+    set "PATH=%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\"
+    for /f "usebackq tokens=2,* skip=2" %%A in (`reg query "HKLM\SYSTEM\CurrentControlSet\Control\Session Manager\Environment" /v PATH`) do set "PATH=%PATH%;%%B"
+)
+
+
+if not exist "venv\Scripts\python.exe" (
+    echo Creating virtual environment...
+    python -m venv venv
+) else (
+    echo Virtual environment already exists.
+)
+
+echo Activating virtual environment...
+call venv\Scripts\activate
+
+echo Installing/updating dependencies from requirements.txt...
+python -m pip install --upgrade pip
+python -m pip install -r requirements.txt
+
+echo Running main script...
+python main.py
+
+echo.
+echo Script has finished. Press any key to exit.
+pause

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+pandas`
	`2`	`+beautifulsoup4`
	`3`	`+python-docx`