Substackのアルゴリズム解説、どこまで信じていいか問題
公開情報・観測データ・推測の境界線を整理する
今回はちょっと毛色の違うテーマです。
Substackを使い始めると、わりと早い段階で「アルゴリズム攻略系」の情報に出くわすんですよね。
自分もいくつか読んで、「うーん、これ本当にそこまで言えるんけ?」ってなってまして。
攻略法を否定したいわけじゃなくて、どこまでが事実でどこからが推測かを整理したくて書きました。
「アルゴリズム攻略」っていう語感の強さの危うさ
最近、Substackのアルゴリズムについて、かなり具体的に語られてるのを見ることが増えてきましたよね。
内容としてはだいたいこんな感じのやつです。
Restack(リスタック)されると古い投稿でも”今の投稿”として再評価される
エンゲージメントが蓄積すると過去投稿も長く循環する
反応が集まった投稿は短命じゃなく資産になる
読んでて、「それ、本当にそこまで言い切れる?」ってなりませんでした?
アルゴリズム解説そのものを否定したいわけじゃないんですよ。
むしろ逆で、どこまでが公開情報で、どこからが観測ベースの推測なのかを整理してみたくて書いてます。
Substackは完全ブラックボックスじゃない
まずここから話すと、Substackは「何も公開していない」わけじゃないんですよね。
公式や関係者が発信の中で話してることはちゃんとあって、こういう話は出てます。〔※1〕〔※2〕
Notes や Recommendations を通じた「発見性(discovery)」の強化
ネットワーク効果の重視
プラットフォーム内での循環や活動促進
つまり、
Restackが露出に影響する
Notesでの反応が可視性に関わる
と考えること自体はそんなにズレてないと思います。ここは特に変なこと言ってないんですよ。
ただし、公開されてるのは「設計思想」であって「データ」じゃない
ここが大事なところで。
Substackが公開してるのは、あくまで「何を重視しているか」という設計思想レベルの話なんですよね。〔※1〕
一方で、こういった情報は公開されてない。〔※3〕
ランキングスコアの計算式
各指標の重みづけ
表示される閾値
鮮度の判定ロジック
Weekly Stack等の選定パラメータ
アルゴリズムの中身は、やっぱりブラックボックスなんです。
だから「Restackされると鮮度が再定義される」みたいな表現には、ちょっと注意が必要かなと思っていて。「ありそう」ではあるんですよね。でも、公開情報だけで断定できる話じゃないんです。
「再評価」じゃなくて「再露出」の可能性が高い
たとえばこういう説明があります。
古い投稿でも Restack によって今の投稿として再評価される
これ、すごく魅力的に聞こえるじゃないですか。でも実際に起きてることって、もっとシンプルかもしれないんですよね。〔※4〕
誰かが Restack する
その人のフォロワーに表示される
新規クリックや再訪問が発生する
これだけでも、古い記事はまた読まれます。
つまり、記事そのものが若返ったんじゃなくて、新しい入口が増えただけとも解釈できるんですよ。「古い記事が蘇った」のか、「別ルートから再び読まれた」だけなのか。
ここ、けっこう重要な違いだと思うんですよね。
観測結果と内部仕様は別物
Restack 後に露出が伸びた、古い記事がまた読まれた、Notes で急に伸びた、みたいな現象を観察して分析すること自体は有益なんですよ。外部観測から傾向を推測するのは十分できることだと思うし、ユーザー間でも同様の観測が多く報告されているんで。〔※4〕
ただ、観測された挙動と内部仕様は別物なんですよね。
たとえば、 「再読が起きた」という結果と、「鮮度が再定義された」という原因推定は別物じゃないですか。
結果から原因をひとつに断定するのは、少し飛躍があるんじゃないかなぁって。
「資産化」の定義を間違えない
もう一個気になってるのが、「エンゲージメントが積み上がって資産になる」という表現で。
確かに Substack は、
メールアーカイブ
過去記事の蓄積
SEO
Recommendations
など、一般的な SNS よりストック性が高いのは本当です。〔※1〕
ただ、本当に資産化されるものって何か?って考えたとき、自分はこう思うんですよね。
本当に積み上がる資産は、
購読者(subscriber)
メールリスト
読者との関係性
信頼残高
だと。
一方で、
Restack 数
Notes での露出
一時的な反応数
は、あくまで途中の指標でしかないんですよ。
言い換えると、Restack 数は資産そのものじゃなくて、資産につながるかもしれない流入指標です。ここを混同すると、手法が目的になりやすい。
問題は「アルゴリズム解説が悪い」じゃなくて、断定の強さ
誤解してほしくないんですが、アルゴリズムについて考察すること自体は全然悪くないですよ。むしろ必要だと思う。
問題なのは、
観測データ
仮説
未公開領域
この3つを曖昧にしたまま、内部仕様のように断定して語ってしまうことで。
専門用語や図解で整理されると、それっぽく見えるんですよね。でも、名前をつけることと、証明することは別です。
最後に
アルゴリズムを知ってるように見える人より、何が分かっていて、何がまだ分からないかを切り分けられる人の方が、自分は信用できるなと思ってます。
Substack はまだ情報非対称が大きい。だからこそ「攻略法」や「内部仕様っぽい解説」は強く見えやすい。
でも本当に見るべきものは、神秘化されたアルゴリズムじゃなくて、
誰に届いたか
誰が登録したか
誰が読み続けてくれているか
そこだと思うんですよね。
手法に飲まれず、目的を見失わないようにしたいですよね。
あとがき
書きながら、「これ自分自身への戒めでもある」ってなりました(笑)
「〇〇すれば伸びる」系の情報、けっこう飛び込んできますよね。
全部疑うのも違うけど、出典と根拠の区別だけはちゃんとしていきたいな、と。
参考文献
〔※1〕Why Substack’s discovery algorithm favors writers who stay in the ecosystem — The Blog Herald(Substack機械学習責任者・Mike Cohenの発言を引用した外部メディア記事)
https://blogherald.com/blog-tips/n-why-substacks-discovery-algorithm-favors-writers-who-stay-in-the-ecosystem/
〔※2〕The Notes algorithm explained (by its actual creator) — PubStack Success(Substack共同創業者・Hamish McKenzieおよびMike Cohenの発言をもとにした解説記事)
https://pubstacksuccess.substack.com/p/the-notes-algorithm-explained-by
〔※3〕Interview with Substack Intelligence — David Arthur Walters(SubstackのAIサポートへの問い合わせ記録。アルゴリズムの非公開方針が確認できる)
https://davidarthurwalters.substack.com/p/01-interview-with-substack-intelligence
〔※4〕How does Substack’s algorithm determine visibility? — Reddit / r/Substack (ユーザーコミュニティでの観測・議論のまとめ。公式情報ではなく体験談・推測が中心)
https://www.reddit.com/r/Substack/comments/1sd1ikk/how_does_substacks_algorithm_determine_visibility/
「それって本当に確かな情報?」を一緒に考えていきたい方、ぜひ購読してみてください。 感想や「自分はこう思う」もあったら、返信で教えてもらえると嬉しいです。



