← ブログに戻る

ニュース記事をMarkdownとして保存する方法

· Save Team
newsarticlesjournalismarchive

ニュースサイトはウェブ上で最も雑然としたページの一つです。広告、ポップアップ、ニュースレター登録プロンプト、Cookieバナー、自動再生動画が実際の記事を取り囲んでいます。ここでは、ジャーナリズムの部分だけをクリーンなMarkdownとして抽出する方法を紹介します。

ニュース記事をMarkdownで保存すべき理由

ニュースコンテンツには独特の保存上の課題があります:

  • 記事がペイウォールの向こうに --- 今日は無料でも明日には有料化
  • コンテンツが予告なく更新される --- 記事が通知なしに変わる
  • サイトリニューアル --- 古い記事のリンクが切れる
  • 雑多な要素が圧倒的 --- 広告、トラッカー、ポップアップが読書を苦痛にする
  • 個人アーカイブがない --- URLが変われば、ブックマークも死ぬ

Saveがキャプチャする内容

記事コンテンツ

  • 見出しとサブ見出し
  • 段落構造を含む記事本文全体
  • 著者と公開日
  • プル引用とハイライトされたテキスト
  • 主要なデータポイントと統計
  • 出典の帰属

Saveが除去する内容

  • ディスプレイ広告とスポンサードコンテンツ
  • ナビゲーションメニューとフッター
  • Cookie同意バナー
  • ニュースレター登録プロンプト
  • 関連記事サイドバー
  • 自動再生動画プレーヤー
  • SNSシェアボタン

出力例

# Tech Giants Report Record AI Infrastructure Spending

**Source:** The Information
**Author:** Sarah Chen
**Published:** March 28, 2026

---

The five largest technology companies spent a combined $87 billion
on AI infrastructure in Q1 2026, a 340% increase from the same
period last year, according to earnings reports released this week.

## Key Numbers
- **Microsoft:** $24B (up from $6B)
- **Google:** $22B (up from $8B)
- **Amazon:** $19B (up from $5B)
- **Meta:** $14B (up from $4B)
- **Apple:** $8B (up from $2B)

> "We're in an infrastructure arms race that makes the dot-com
> era look modest," said analyst James Park at Morgan Stanley.

## What They're Building
The spending breaks down into three categories:
1. **GPU clusters** — primarily Nvidia H200 and B200
2. **Custom silicon** — Google TPUs, Amazon Trainium, Apple M-series
3. **Data centers** — new facilities in 14 countries

ユースケース

個人のニュースアーカイブ

  • 毎週読んだ最も重要な記事を保存
  • トピック別に整理された検索可能なアーカイブを構築
  • 後にペイウォールの向こうに入る記事へのアクセスを失わない

リサーチと分析

  • あるトピックに関する複数メディアの報道を収集
  • 日や週をまたいでストーリーがどう進展するか追跡
  • レポートやプレゼンテーションのためのソース素材を構築

メディアモニタリング

  • 自社や業界に関する報道を保存
  • プレスでの競合の言及を追跡
  • プロダクトレビューやアナリストのカバレッジをアーカイブ

AIによるブリーフィング

  • 記事を保存してAIにデイリーブリーフィングを作成させる
  • 複数のソースにまたがる報道をAIに統合させる
  • 個人のニュースライブラリからサマリーを生成

より良い結果を得るためのヒント

  1. ほとんどのニュースサイトで動作 --- NYT、WSJ、BBC、Bloomberg、The Guardian、TechCrunch、The Verge、Ars Technicaなど多数
  2. ペイウォール記事 --- コンテンツが表示されていれば(購読やフリー記事経由で)、Saveがキャプチャ可能
  3. リーダーモードを超える --- SaveのAI抽出はブラウザのリーダーモードよりも徹底的
  4. オリジナルを保存 --- Apple NewsやGoogle Newsのリダイレクトからではなく、記事のURLから保存

はじめよう

Chrome Web StoreからSaveをインストール --- ニュースアーカイブを構築しましょう。


ご質問は [email protected] まで