- upstream sinmb79/blog-writer v3.2.1 코드 베이스 적용 - config_resolver, CLI, writer_bot, shorts pipeline 등 신규 기능 포함 - load_dotenv Windows 경로 → Docker 호환 load_dotenv() 변경 (25개 파일) - runtime_guard.py Docker 환경 bypass 추가 - config/blogs.json: eli-ai 블로그 정체성 (8개 카테고리) - config/sources.json: 38개 RSS 소스 유지 - config/engine.json: writing provider → gemini (2.5-flash) - config/safety_keywords.json: 모든 글 수동 승인 (score 101) - bots/scheduler.py: 시스템 프롬프트 eli 블로그 기준으로 업데이트 - bots/publisher_bot.py: .env refresh token OAuth 폴백 로직 추가 - requirements.txt: google-generativeai, groq 활성화 - Dockerfile + docker-compose.yml: NAS Docker 배포 설정 - CLAUDE.md: 프로젝트 메타데이터 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
272 lines
8.9 KiB
Python
272 lines
8.9 KiB
Python
"""
|
|
글쓰기 봇 (bots/writer_bot.py)
|
|
역할: topics 폴더의 글감을 읽어 EngineLoader 글쓰기 엔진으로 원고를 생성하고
|
|
data/originals/에 저장하는 독립 실행형 스크립트.
|
|
|
|
호출:
|
|
python bots/writer_bot.py — 오늘 날짜 미처리 글감 전부 처리
|
|
python bots/writer_bot.py --topic "..." — 직접 글감 지정 (대화형 사용)
|
|
python bots/writer_bot.py --file path/to/topic.json
|
|
|
|
대시보드 manual-write 엔드포인트에서도 subprocess로 호출.
|
|
"""
|
|
import argparse
|
|
import json
|
|
import logging
|
|
import re
|
|
import sys
|
|
from datetime import datetime
|
|
from pathlib import Path
|
|
|
|
from dotenv import load_dotenv
|
|
|
|
load_dotenv()
|
|
|
|
BASE_DIR = Path(__file__).parent.parent
|
|
sys.path.insert(0, str(BASE_DIR))
|
|
sys.path.insert(0, str(BASE_DIR / 'bots'))
|
|
|
|
DATA_DIR = BASE_DIR / 'data'
|
|
LOG_DIR = BASE_DIR / 'logs'
|
|
LOG_DIR.mkdir(exist_ok=True)
|
|
|
|
logging.basicConfig(
|
|
level=logging.INFO,
|
|
format='%(asctime)s [%(levelname)s] %(message)s',
|
|
handlers=[
|
|
logging.FileHandler(LOG_DIR / 'writer.log', encoding='utf-8'),
|
|
logging.StreamHandler(),
|
|
],
|
|
)
|
|
logger = logging.getLogger(__name__)
|
|
|
|
|
|
# ─── 유틸 ────────────────────────────────────────────
|
|
|
|
def _safe_slug(text: str) -> str:
|
|
slug = re.sub(r'[^a-z0-9]+', '-', text.lower()).strip('-')
|
|
return slug or datetime.now().strftime('article-%Y%m%d-%H%M%S')
|
|
|
|
|
|
def _build_prompt(topic_data: dict) -> tuple[str, str]:
|
|
topic = topic_data.get('topic', '').strip()
|
|
corner = topic_data.get('corner', '쉬운세상').strip() or '쉬운세상'
|
|
description = topic_data.get('description', '').strip()
|
|
source = topic_data.get('source_url') or topic_data.get('source') or ''
|
|
published_at = topic_data.get('published_at', '')
|
|
|
|
system = (
|
|
"당신은 The 4th Path 블로그 엔진의 전문 에디터다. "
|
|
"반드시 아래 섹션 헤더 형식만 사용해 완성된 Blogger-ready HTML 원고를 출력하라. "
|
|
"본문(BODY)은 HTML로 작성하고, KEY_POINTS는 3줄 이내로 작성한다."
|
|
)
|
|
prompt = f"""다음 글감을 바탕으로 한국어 블로그 원고를 작성해줘.
|
|
|
|
주제: {topic}
|
|
코너: {corner}
|
|
설명: {description}
|
|
출처: {source}
|
|
발행시점 참고: {published_at}
|
|
|
|
출력 형식은 아래 섹션만 정확히 사용해.
|
|
|
|
---TITLE---
|
|
제목
|
|
|
|
---META---
|
|
검색 설명 150자 이내
|
|
|
|
---SLUG---
|
|
영문 소문자 slug
|
|
|
|
---TAGS---
|
|
태그1, 태그2, 태그3
|
|
|
|
---CORNER---
|
|
{corner}
|
|
|
|
---BODY---
|
|
<h2>...</h2> 형식의 Blogger-ready HTML 본문
|
|
|
|
---KEY_POINTS---
|
|
- 핵심포인트1
|
|
- 핵심포인트2
|
|
- 핵심포인트3
|
|
|
|
---COUPANG_KEYWORDS---
|
|
키워드1, 키워드2
|
|
|
|
---SOURCES---
|
|
{source} | 참고 출처 | {published_at}
|
|
|
|
---DISCLAIMER---
|
|
필요 시 짧은 면책문구
|
|
"""
|
|
return system, prompt
|
|
|
|
|
|
# ─── 핵심 로직 ───────────────────────────────────────
|
|
|
|
def write_article(topic_data: dict, output_path: Path) -> dict:
|
|
"""
|
|
topic_data → EngineLoader 호출 → article dict 저장.
|
|
Returns: article dict (저장 완료)
|
|
Raises: RuntimeError — 글 작성 또는 파싱 실패 시
|
|
"""
|
|
from engine_loader import EngineLoader
|
|
from article_parser import parse_output
|
|
|
|
title = topic_data.get('topic', topic_data.get('title', ''))
|
|
logger.info(f"글 작성 시작: {title}")
|
|
|
|
system, prompt = _build_prompt(topic_data)
|
|
writer = EngineLoader().get_writer()
|
|
raw_output = writer.write(prompt, system=system).strip()
|
|
|
|
if not raw_output:
|
|
raise RuntimeError('글쓰기 엔진 응답이 비어 있습니다.')
|
|
|
|
article = parse_output(raw_output)
|
|
if not article:
|
|
raise RuntimeError(f'글쓰기 엔진 출력 파싱 실패 (앞 200자): {raw_output[:200]}')
|
|
|
|
article.setdefault('title', title)
|
|
article['slug'] = article.get('slug') or _safe_slug(article['title'])
|
|
article['corner'] = article.get('corner') or topic_data.get('corner', '쉬운세상')
|
|
article['topic'] = topic_data.get('topic', '')
|
|
article['description'] = topic_data.get('description', '')
|
|
article['quality_score'] = topic_data.get('quality_score', 0)
|
|
article['source'] = topic_data.get('source', '')
|
|
article['source_url'] = topic_data.get('source_url') or topic_data.get('source') or ''
|
|
article['published_at'] = topic_data.get('published_at', '')
|
|
article['created_at'] = datetime.now().isoformat()
|
|
|
|
output_path.parent.mkdir(parents=True, exist_ok=True)
|
|
output_path.write_text(
|
|
json.dumps(article, ensure_ascii=False, indent=2),
|
|
encoding='utf-8',
|
|
)
|
|
logger.info(f"원고 저장 완료: {output_path.name}")
|
|
return article
|
|
|
|
|
|
def run_pending(limit: int = 3) -> list[dict]:
|
|
"""
|
|
data/topics/ 에서 오늘 날짜 미처리 글감을 최대 limit개 처리.
|
|
Returns: 처리 결과 리스트 [{'slug':..., 'success':..., 'error':...}]
|
|
"""
|
|
topics_dir = DATA_DIR / 'topics'
|
|
originals_dir = DATA_DIR / 'originals'
|
|
originals_dir.mkdir(parents=True, exist_ok=True)
|
|
|
|
today = datetime.now().strftime('%Y%m%d')
|
|
topic_files = sorted(topics_dir.glob(f'{today}_*.json'))
|
|
|
|
if not topic_files:
|
|
logger.info("오늘 날짜 글감 없음")
|
|
return []
|
|
|
|
results = []
|
|
processed = 0
|
|
for topic_file in topic_files:
|
|
if processed >= limit:
|
|
break
|
|
output_path = originals_dir / topic_file.name
|
|
if output_path.exists():
|
|
logger.debug(f"이미 처리됨: {topic_file.name}")
|
|
continue
|
|
try:
|
|
topic_data = json.loads(topic_file.read_text(encoding='utf-8'))
|
|
article = write_article(topic_data, output_path)
|
|
results.append({'file': topic_file.name, 'slug': article.get('slug', ''), 'success': True})
|
|
processed += 1
|
|
except Exception as e:
|
|
logger.error(f"글 작성 실패 [{topic_file.name}]: {e}")
|
|
results.append({'file': topic_file.name, 'slug': '', 'success': False, 'error': str(e)})
|
|
|
|
return results
|
|
|
|
|
|
def run_from_topic(topic: str, corner: str = '쉬운세상') -> dict:
|
|
"""
|
|
직접 주제 문자열로 글 작성.
|
|
Returns: article dict
|
|
"""
|
|
originals_dir = DATA_DIR / 'originals'
|
|
originals_dir.mkdir(parents=True, exist_ok=True)
|
|
|
|
slug = _safe_slug(topic)
|
|
filename = f"{datetime.now().strftime('%Y%m%d_%H%M%S')}_{slug}.json"
|
|
output_path = originals_dir / filename
|
|
|
|
topic_data = {
|
|
'topic': topic,
|
|
'corner': corner,
|
|
'description': '',
|
|
'source': '',
|
|
'published_at': datetime.now().isoformat(),
|
|
}
|
|
return write_article(topic_data, output_path)
|
|
|
|
|
|
def run_from_file(file_path: str) -> dict:
|
|
"""
|
|
JSON 파일에서 topic_data를 읽어 글 작성.
|
|
"""
|
|
originals_dir = DATA_DIR / 'originals'
|
|
originals_dir.mkdir(parents=True, exist_ok=True)
|
|
|
|
topic_file = Path(file_path)
|
|
topic_data = json.loads(topic_file.read_text(encoding='utf-8'))
|
|
output_path = originals_dir / topic_file.name
|
|
return write_article(topic_data, output_path)
|
|
|
|
|
|
# ─── CLI 진입점 ──────────────────────────────────────
|
|
|
|
def main():
|
|
parser = argparse.ArgumentParser(description='The 4th Path 글쓰기 봇')
|
|
parser.add_argument('--topic', type=str, help='직접 글감 지정')
|
|
parser.add_argument('--corner', type=str, default='쉬운세상', help='코너 지정 (기본: 쉬운세상)')
|
|
parser.add_argument('--file', type=str, help='글감 JSON 파일 경로')
|
|
parser.add_argument('--limit', type=int, default=3, help='최대 처리 글 수 (기본: 3)')
|
|
args = parser.parse_args()
|
|
|
|
if args.topic:
|
|
try:
|
|
article = run_from_topic(args.topic, corner=args.corner)
|
|
print(f"[완료] 제목: {article.get('title', '')} | slug: {article.get('slug', '')}")
|
|
sys.exit(0)
|
|
except Exception as e:
|
|
print(f"[오류] {e}", file=sys.stderr)
|
|
sys.exit(1)
|
|
|
|
if args.file:
|
|
try:
|
|
article = run_from_file(args.file)
|
|
print(f"[완료] 제목: {article.get('title', '')} | slug: {article.get('slug', '')}")
|
|
sys.exit(0)
|
|
except Exception as e:
|
|
print(f"[오류] {e}", file=sys.stderr)
|
|
sys.exit(1)
|
|
|
|
# 기본: 오늘 날짜 미처리 글감 처리
|
|
results = run_pending(limit=args.limit)
|
|
if not results:
|
|
print("[완료] 처리할 글감 없음")
|
|
sys.exit(0)
|
|
|
|
ok = sum(1 for r in results if r['success'])
|
|
fail = len(results) - ok
|
|
print(f"[완료] 성공 {ok}건 / 실패 {fail}건")
|
|
for r in results:
|
|
status = '✅' if r['success'] else '❌'
|
|
err = f" ({r.get('error', '')})" if not r['success'] else ''
|
|
print(f" {status} {r['file']}{err}")
|
|
|
|
sys.exit(0 if fail == 0 else 1)
|
|
|
|
|
|
if __name__ == '__main__':
|
|
main()
|