-
Notifications
You must be signed in to change notification settings - Fork 6
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
新形式のHTMLへの対応検討 #11
Comments
外観
|
>>1が出てくるあたりの様子
残りが出てくるあたり
|
1レスの構造 >>1 <article id="1" data-date="NG" data-userid="ID:7vrFofOj0" data-id="1" class="clear post"><details open class="post-header"><summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 19:06:22.49</span><span class="uid">ID:7vrFofOj0</span></details><section class="post-content"> 前スレ <br> 2chAPIProxy 22 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1675228865/">https://egg.5ch.net/test/read.cgi/software/1675228865/</a> </section></article> >>21以降 <article id="3" data-date="NG" data-userid="ID:Nzcn4Kgf0" data-id="3" class="clear post"><details open class="post-header"><summary><span class="postid">0003</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 20:21:15.82</span><span class="uid">ID:Nzcn4Kgf0</span></details><section class="post-content"> こいつどうする <br> <br> 2chAPIProxy 23 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1683969568/">https://egg.5ch.net/test/read.cgi/software/1683969568/</a> </section></article> 1だけ分かれてるだけで違いはないっぽい 整形 <article id="1" data-date="NG" data-userid="ID:7vrFofOj0" data-id="1" class="clear post">
<details open class="post-header">
<summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 19:06:22.49</span><span class="uid">ID:7vrFofOj0</span></details>
<section class="post-content"> 前スレ <br> 2chAPIProxy 22 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1675228865/">https://egg.5ch.net/test/read.cgi/software/1675228865/</a> </section>
</article> 凡例( <article id="**レス番号**" data-date="NG" data-userid="**id文字列**" data-id="**レス番号**" class="clear post">
<details open class="post-header">
<summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:**メ欄**">**名前欄**</a></b></span></summary><span class="date">**投稿日時**</span><span class="uid">**id文字列**</span></details>
<section class="post-content"> **本文** </section>
</article> 参考、以前の形式 <div class="post" id="**レス番号**" data-date="NG" data-userid="**id文字列**" data-id="**レス番号**">
<div class="meta">
<span class="number">0005</span><span class="name"><b><a href="mailto:**メ欄**">**名前欄**</a></b></span><span class="date">**投稿日時**</span><span class="uid">**id文字列**</span></div>
<div class="message"><span class="escaped"> **本文** </span></div>
</div><br> |
スレタイ周辺 今回の
従来
|
メ欄が空だとこうなる <article id="78" data-date="NG" data-userid="ID:SOlB5TFd0" data-id="78" class="clear post">
<details open class="post-header">
<summary><span class="postid">0078</span><span class="postusername"><b>名無しさん@お腹いっぱい。</b></span></summary><span class="date">2023/06/02(金) 18:43:38.40</span><span class="uid">ID:SOlB5TFd0</span></details>
<section class="post-content"> <a href="../test/read.cgi/software/1683972382/77" rel="noopener noreferrer" target="_blank" class="reply_link">>>77</a> <br> 串には内部串と外部串があってな </section>
</article> つまり
その他名前欄バリエーション
|
beのある場合 <article id="2" data-date="NG" data-userid="ID:QOxLhn3Q" data-id="2" class="clear post">
<details open class="post-header">
<summary><span class="postid">0002</span><span class="postusername"><b>名無しさん@ログイン中</b></span></summary><span class="date">2022/09/05(月) 19:05:55.09</span><span class="uid">ID:QOxLhn3Q</span><span class="be rS★"><a href="http://be.5ch.net/user/676665312" target="_blank">?S★(2770727)</a></span></details>
<section class="post-content"> <img src="//img.5ch.net/premium/6666924.gif"> <br> テスト </section>
</article>
<article id="15" data-date="NG" data-userid="ID:Jo4mdSOi" data-id="15" class="clear post">
<details open class="post-header">
<summary><span class="postid">0015</span><span class="postusername"><b>名無しさん@ログイン中</b></span></summary><span class="date">2022/09/26(月) 15:43:27.31</span><span class="uid">ID:Jo4mdSOi</span><span class="be r2BP"><a href="http://be.5ch.net/user/823355746" target="_blank">?2BP(0)</a></span></details>
<section class="post-content"> <img src="//img.5ch.net/ico/nida.gif"> <br> てすと </section>
</article> 日付の後のIDの
つまりここは変わらない 本文のアイコンは
|
krsw鯖、相変わらずおかしい 新しい形式でも、htmlが1行に畳まれている・・・ 2023/06/20時点では治ってるぽい |
AAを判定すると表示が変わるらしい
つまり、
古いのも確認したら同じようになってた(元からそうだっけ・・・ |
IDなしの場合
|
p53 新しいの
今までの
|
お絵描き
本文
古いの
datとの対応はこんなかんじ
ssspリンクに直してimgタグを取るが、先頭の |
安価
古いの
さらに古いの(2016/03)
|
あぼーん
うふ~ん
昔の(API以前からのhtml形式)
|
1つ前の形式のバグ これが
こうなる(例えば)
こうなるのが正解のはず
なにか日付とIDがともにNGの場合に特殊対応しているけど、ID:NG0が一体何だったのかもはや・・・ 同スレの下の方にも似たようなやつがある |
This comment was marked as resolved.
This comment was marked as resolved.
|
302 Foundで失敗していて、2chAPIProxyのログに何も出てないなら、差分検出に失敗しているっぽい そこは現状改善の余地がない気がする・・・ |
|
新しい形式
もっとも異なるのは
どんぐり関連の何かが混入している |
ワッチョイ
ズームすると
be
ズームすると
|
なんかよく分からないけど、古いHTMLを取得して変換可能な場合があるっぽい?(UAもしくは何らかのキャッシュ?) ローカル環境の2023/06/14の 多分、 |
2023/06/14早朝ごろから?
https://egg.5ch.net/test/read.cgi/software/1683972382/
だとモダンなページが表示されhttps://egg.5ch.net/test/read.cgi/c/software/1683972382/
だと従来のページが表示される現状はとりあえずHTML取得時に下のURLに切り替えて対処しているが、いつまで従来のページがサポートされるか不明なこととすべての板がこの形式に移行しているか(すべてのスレURLで下の形式が有効か)わからないため新しい形式への対応が必要
The text was updated successfully, but these errors were encountered: