トップページPINK運用情報
573コメント218KB
スパムのブラックリストを作りましょうかねぇ
■ このスレッドは過去ログ倉庫に格納されています
0001Jack ★2013/06/05(水) 18:56:21.11ID:???
スパム投稿削除システムの為にスパムリストを作ります。
どうやってリストを作るかをわいわいしましょう
0220名無し編集部員2013/06/08(土) 15:11:58.53ID:W8Z5h2rx
おーHaskell製か
相当レベル高いプログラマが居そうだな
0221 ◆Rock54hC3G0C 2013/06/09(日) 01:43:35.02ID:/JfBpAle
>>219
Haskellって初めて聴きました。
wikipediaでHaskellを眺めてみました。
とても難解な構文だと感じました。
そしてメリットをあまり感じませんでした。
使えると「レベルの高いプログラマと認められる」のかなと、虚しく感じました。
0222 ◆Rock54hC3G0C 2013/06/09(日) 01:49:46.64ID:/JfBpAle
そして、私が気に掛けているのは、実際に書き込まれたときの処理に関することです。
処理するのはbbs.cgiですので内容はperlで描かれているはずです。
(ただし、すでにHaskellで描き直されているのであればこの行以降、意味をなしません)
そのperlに実装されているRegExp(PCRE)を利用するのであれば、
諸々の注意しなければならないことがあることを助言したのであります。
0223名無し編集部員2013/06/09(日) 01:49:59.92ID:+/y9rh3u
Haskellにも正規表現実装されてるぽいんだけど
アスキーコードに対してしか使用できない?のかな?
Jimさんも正規表現の話をperlのものとして切り捨ててるみたいだけど
逆にperlならできることを態々できない言語でやるってのは得意分野いかしてない感じだが
Haskellでやることのメリットはどの辺にあるのかな?
0224名無し編集部員2013/06/09(日) 01:55:00.60ID:+/y9rh3u
書き込まれた後でdatから削除するシステムみたいだから
bbs.cgiとは連動していないんじゃないかな?
0226名無し編集部員2013/06/09(日) 02:42:16.98ID:9YqVA6Hu
>>223
ざっと本家を読んだ限りではプログラムの長さが短くすみ、メンテしやすい。
型(数字やテキスト)やメモリアロケーション(無限長の配列を
扱えるが、実行時にプログラム側が必要に応じて勝手にやってくれる)
の心配をせず、割とアバウトにプログラムができるためプログラミング
エラーを起こしにくい。デメリットは、実行速度の最適化が難しいのと
最初の学習ハードルが高いぐらいかな。

現在のPINKHeadlineが書き込みが行われたスレをリアルタイムでピック
アップしていることから、bbs.cgiで書かれた後のdatをスクリーニングする
仕組みがすでにあるんだろうと思う。
0227名無し編集部員2013/06/09(日) 02:43:15.39ID:N3FxWQCx
bbs.cgiには手を加えないんだと思う
だから書き込む前でなく、書き込んだ直後に削除という話になるんで

Haskellは構文解析向けだから、広告対応ならうってつけ
副作用が無いからマルチスレッド化の恩恵も受けやすい

…というのがわかってても、難しいからおれには書けない
無理に書いてもperlで書いたのと変わらない
Haskellでしっかりシステム書ける人は大したもんだなあと思うだけだよ
0228Apparently admin ★2013/06/09(日) 07:23:45.17ID:???
>>220-227
Perlは重要です。インターネットはPerlの上に建てられた。
良い面とすべてのプログラミング言語の悪い側面があります。
巡航ミサイルはbbs.cgiに触れていないので、rock54干渉すべきではない。
実際にはrock54は追加のチェックとして、このシステムを助けるでしょう。
Google
Perl is important. The internet was built on Perl.
There are good aspects and bad aspects of all programming languages.
The cruise missile is not touching the bbs.cgi, so it should not interfere with rock54.
In fact rock54 will help this system as an additional check.
0229名無し編集部員2013/06/09(日) 10:39:19.39ID:64oGe8v4
この新システムってRock54と違って登録されたurlは一切存在を許さないってシステムだよね?
特定のurlを排除する目的で(このシステムに登録させることを目的として)マルポしてくる荒らしがでると思うけど
それはどう対処するの?
0231名無し編集部員2013/06/09(日) 12:35:39.18ID:TZDfIxpm
GL7(≒広告宣伝≒スパム)に該当しないurlなら、当面これまで通り手動で削除するんでないかな
>>5
0232 ◆ERO/DUMPAE 2013/06/10(月) 08:10:20.79ID:UBpIuFXz
>>229
|特定のurlを排除する目的でマルポしてくる荒らしがでると思う

( ^ω^) なかなか面白い発想であります!

結果として、排除された状態を考えてみたけれども、
ピンクちゃんねるの投稿として該当サイトへのURLが排除されるのだから
該当サイトへのURLが記載されたレスが残らない状態ですよね?

それって何かの弊害が出るのでしょうか?

現段階で想定できる弊害としては、該当サイトを話題とするスレなどでは、
該当サイトのコンテンツを示すURLが記載できない状態でしょうか?

(´ε`;) それって、どんな問題になるのかな?
0233 ◆ERO/DUMPAE 2013/06/10(月) 08:12:44.01ID:UBpIuFXz
>>219
|システムはperlスクリプトではありません。それは、Haskellのプログラムです。

Haskellか…

( ´ー`)y-~~ なんか懐かしいですね♪
0234 ◆ERO/DUMPAE 2013/06/10(月) 08:34:28.21ID:UBpIuFXz
(*゚ー゚) レスを全て読むのって、めんどくさい!

なのでここまでを読んで感じたことだけを書くね♪

正規表現で云々とか出ているけれども、今の段階で実装しようとしている機能性について、正規表現を掘り下げて検討する必要があるのかな?

正規表現を活用して、可変的なURLが書かれた投稿を排除すること、これは重要なことかもしれない。
けれども現段階では、完全一致で排除して行く機能を、まずは実装してみることが優先される気もする。
まずは完全一致で排除する機能をピンクちゃんねるが実装すること、これによりJIM管理人さんの意向としてスパム投稿を排除したい考えを公表できるんだと思う。

後に、いたちごっこになると思われるんだが、再びURLを変更してスパム投稿を繰り返す輩が現れた場合にどうするか?
こうしたスパムな投稿を繰り返す方々については、ピンクちゃんねるの利用をご遠慮願う事態(規制)に至るのか?
そうした場合には、該当の個人そのものの利用をご遠慮願う(個人特定での規制)のが妥当なのか?
それとも、そうした問題となるサイトへの誘導を目的とした投稿(スパム投稿)を排除するのが妥当になるのか?

個人を規制するのか、スパム投稿を規制するのか?

やっぱりスパム投稿を規制するのが、ピンクちゃんねるとしての考えなのか?
それならば、スパム投稿に書かれるであろうURLを正規表現を活用して規制して行くことの検討が必要なんだろうね…
0235 ◆ERO/DUMPAE 2013/06/10(月) 08:43:30.48ID:UBpIuFXz

に書いたことを拡大して掘り下げると、

 ・過去にスパム投稿をした方については
 ・その方が投稿する情報においてのみ、特定のサイトへ誘導する投稿を排除する

そんな考えに至る可能性もあるなと思いました。

これって、傷ある方が特定サイトへ誘導する投稿のみ、これを排除する機能となって、個人毎の制約を設定できる機能に至ると思いました。



( ゚д゚)ハッ! これって、Rock*機能なの?
0236名無し編集部員2013/06/10(月) 08:48:28.27ID:pAGFb2zi
>該当サイトのコンテンツを示すURLが記載できない状態でしょうか?

>(´ε`;) それって、どんな問題になるのかな?

じゃあ最初からpinkや2ch以外のURLは全部お断りにすればいいんじゃねえの?
あほが
0237Jack ★2013/06/10(月) 08:49:24.27ID:???
>>229
そのようなURLが登録されていたら、申請によってリストから外す事が出来るでしょう

>>230
荒らし報告があれば掘るかもですね

>>231
だと思います。
0238名無し編集部員2013/06/10(月) 09:01:45.93ID:pAGFb2zi
実際的には企業系のサイトなら広告性が皆無のところの方が少ないですから
宣伝的な文言をつけてURLをばら撒かれたらGL7該当と判断される可能性あると思いますけどね
0239Apparently admin ★2013/06/10(月) 11:49:54.97ID:???
>>234
ほんとにそのとり。どもありがとうございます。
0240名無し編集部員2013/06/10(月) 12:07:34.14ID:4NbCI/CF
やっぱり問題点が理解されていないんだな…
可変的なURLへの対応なんて誰も求めてないよ
なんで狙ったドメインだけ削除できないの?っていうことしか話されていない
まあ今のクソ仕様だと運用する人がクソ苦労するか
苦労した挙句にやっぱり誤爆して非難轟々までいってしまうかという感じだが
俺にはかんけーねーしな
自分の常駐スレとかで誤爆が起きないことだけ祈っとくわ
0241名無し編集部員2013/06/10(月) 12:08:43.54ID:qUeJHU3B
最近の大量マルチポスト系の広告(pdayz,waku2,156.jp)は皆●持っていて
忍法帳入ってない板で大量投稿。忍法帳入ってる板で水遁されると
1日〜2日静かで、レベルがあがれば、また大量投稿の傾向なので、
自動水遁や自動●記録→[自動/手動]●焼きも搭載できるといいですね。

そういう連中の次の手は、まだ登録されていないドメイン見つけて
投稿。すぐ次のが見つからないと困るので今まで以上に大量に投稿
しておくという感じがするので●を止めるのは必要な気がします。
0242名無し編集部員2013/06/10(月) 17:00:38.78ID:2kX3KUhA
誤爆したら解除すればいいだけ
誤爆で剥奪ならRockerなんてとうの昔に全滅してるよ
相互にフォローできるようになれば理想的

狙ったドメインってニジェールやコロンビア?
まずそのドメインを使う事が想定しにくいし、登録自体を解除すればいいだけ
2chでは短縮がごっそりさくらになってるけど、99%は問題ない感じ

どの辺りまで排除するかが問題であって誤爆自体は大した問題じゃない
一応>>31の感じでやればいい。偽ブランドいいドメインを取ってたらユーザーIDまで島録すりゃいいだけ
0244名無し編集部員2013/06/10(月) 17:33:05.51ID:rofHYFks
もう発動したのかな?ちょっと見た感じ、女神板とえっちねた板の一部が「あは〜ん」になってた。
0245Apparently admin ★2013/06/10(月) 18:41:15.85ID:???
>>243-244
这是一个糟糕的域名?
0247名無し編集部員2013/06/10(月) 18:52:38.73ID:+lWd0i57
Googleさんで>>245を日本語にしてもらった

> これは悪い名前です?
0248名無し編集部員2013/06/10(月) 18:59:21.90ID:oLpbF9Su
ためんなるねぇ
0249C ◆Odemonkey. 2013/06/10(月) 19:10:42.17ID:HFPyUob7
>>248
How do you like the new spam killer?
0251C ◆Odemonkey. 2013/06/10(月) 19:22:11.00ID:HFPyUob7
>> 250
Your wish coming right up!
0252C ◆Odemonkey. 2013/06/10(月) 19:23:32.56ID:HFPyUob7
>>250
Step One: Charge the laser.
Step Two: Fire.
0253 ◆FUCKKER.Gw 2013/06/10(月) 19:30:09.12ID:LF2pBVa4
Thank you Codemonkey-san
0254C ◆Odemonkey. 2013/06/10(月) 19:55:20.10ID:HFPyUob7
Dont mind me, im just curing cancer over here.
0255名無し編集部員2013/06/10(月) 20:15:38.39ID:MaN/SnfB
うふ〜ん と あは〜ん で区別は出来るけど、原因がわかりずらい
[NG Word]や[NGワードが含まれています]みたいな感じにした方がいいと思う

理想的には、引っかかったキーワードや、苦情の連絡先も書いてあるといいけど
あんまり色々書くと500KB制限の問題が出てくるだろうし
0256名無し編集部員2013/06/10(月) 21:16:14.64ID:DgNd2Obr
>>243
この荒らしさんは短縮URLなども使っているみたいなので
最終転送先のURLで書き込み規制できないでしょうか?


転送先URL


ハッピー/?af7169890
ワクワク/?f4452126
イクヨクルヨAF1118413
aso-bo/v18292258
0257 ◆FUCKKER.Gw 2013/06/10(月) 21:24:08.29ID:IXPNbHF8
>>256
Please try this one. http://bbs-ad.com
It is the best way to get your url all over this bbs.
Just go to bbs-ad.com and they add you.
0259Apparently admin ★2013/06/10(月) 21:36:06.16ID:???
>>258
Thank you for your submission..:)
0261名無し編集部員2013/06/10(月) 21:40:20.05ID:DgNd2Obr
>>259
Thank you.
0262Apparently admin ★2013/06/10(月) 21:43:45.51ID:???
どういたしまして。
0263名無し編集部員2013/06/10(月) 21:51:04.23ID:lc/aYk5N
>>255
うふ〜ん はレス削除
あは〜ん は今回議論されてる自動削除
原因は何らかのNG Wordに引っかかったため削除、なのでわかりづらくはありません。

また、引っかかったキーワードを残しては削除した意味がありませんし、
マルチの投稿者に引っかかったワードをわざわざ教えてあげる必要もありません。

一般の投稿者の通常の書き込みで引っかかることは考えにくいですが、
引っかかった場合は>>102のように対応していただくしかありませんね。
0264名無し編集部員2013/06/10(月) 22:06:53.42ID:jK+f/70T
今回のこのシステムってPINKには有効で
2ちゃんねるには適応されないんだよね?

なんか2ちゃんねるからの誤依頼が多くなりそうな予感
0265名無し編集部員2013/06/10(月) 22:14:36.98ID:2kX3KUhA
そこまで賑わったら成功でしょ
一部は2ちゃんに逃げるんじゃないかな。あっちは書き放題なんだし
やってみないことにはなんともだが
0267名無し編集部員2013/06/10(月) 22:30:50.25ID:2kX3KUhA
>>266
566.jpに転送してるから一緒でしょ
この手の人はとことんやるからなあ
0268Apparently admin ★2013/06/10(月) 22:38:08.60ID:???
>>266
どもありがとうございます。
0270名無し編集部員2013/06/10(月) 23:57:53.46ID:+lWd0i57
今のところ「あは〜ん」だけなのね
0271名無し編集部員2013/06/10(月) 23:58:16.39ID:/QF9bjFC
広告ではここまでのスピードでポストしてくる事は少ないかもしれませんが
ツールと書き込みが衝突してトラブルになる可能性はあるのだろうか?

> Malform reporting format
> Summary
> http://kilauea.bbspink.com/test/read.cgi/soap/1370869333/2 2013/06/10 22:10:12.82 ID:BiXcLap60
> |
> keyword: 先生、処女を貴重だと思う男は多いです」孔子「その通りだ|面白いことに、エイズがどうのとニュース|昨日、財布の中から怪しげなカード
> ID:(BiXcLap60|/gey8Mm20|FTQ19rjX0|oENiQ9DP0|nDUP2rz30|XshOBwpY0|gZ/vGIZ90)
> total: 999
> |
> http://kilauea.bbspink.com/test/read.cgi/soap/1370869333/1000 2013/06/10 23:48:30.40 ID:/gey8Mm20
0272名無し編集部員2013/06/11(火) 00:02:35.19ID:CPdcjjV0
>>271
ありゃ、pinkはsamba突破制限が入ってないのね(´・ω・`)
0274名無し編集部員2013/06/11(火) 00:25:17.54ID:D2lvjIq5
pinkの削除は頑張ってると思うけど規制系は弱いね
というか手つかず感がすごい
忍者だけでは難しいよ
0275名無し編集部員2013/06/11(火) 00:59:47.37ID:y/vLK3Sa
宣伝が入るたびに再読み込みしないといけないと不満が出ているようです
0276名無し編集部員2013/06/11(火) 01:17:36.18ID:kAmBqaDz
>>275は2ch専用ブラウザの話
2ch Viewerって書けばわかるかな

でも専ブラごとに仕組みは違うし
対応するっていっても難しそうな
0278名無し編集部員2013/06/11(火) 01:51:40.79ID:zpapJmsP
>>276
2ch Viewerだと●の事ですね

削除が入ったときに手動でリロードしないといけない専用ブラウザってそんなに多いのかな?
ギコナビもrep2も基本勝手にリロードしてくれるので、そういうものだと思ってたんだけど
0279削ウサッチ ★2013/06/11(火) 01:58:42.23ID:???
なんか面白いのが出来てる・・・
0280名無し編集部員2013/06/11(火) 06:36:30.85ID:4vd+6DaC
>>275
その不満は宣伝スパムしてる人にぶつけるべきものだと思いまーす
0281Apparently admin ★2013/06/11(火) 06:55:59.91ID:???
>>277
どもありがとうございます。
0285名無し編集部員2013/06/11(火) 10:29:17.19ID:1cffNDG/
>>277
過去の報告 http://pele.bbspink.com/test/read.cgi/ccc/1366352858/ を見る限り、
citizun.comを含むすべてのURLを書き込み規制するか、最終転送先で判断して書き込み規制していただきたいのですが、
難しいでしょうか?
0286名無し編集部員2013/06/11(火) 10:56:01.45ID:qUXDAg33
ドメインを狙い撃ちできる機能はないので
1つ1つ地道に登録するしかないかと
0287名無し編集部員2013/06/11(火) 11:04:56.08ID:5EVgfLt9
転送先まで見るのはどうしても重くなるから難しそう
0290Jack ★2013/06/11(火) 12:17:21.94ID:???
>>189
えっと、昨日の新聞的ですけれども
そのあたりの問題は解決されたそうです。
チェックをお願いいたします。
0293名無し編集部員2013/06/11(火) 18:52:47.44ID:F/25QO6h
>>291
げっちゅ屋のリンクが原因の1つらしいと月別でウワサされてた
0294名無し編集部員2013/06/11(火) 18:55:19.21ID:F/25QO6h
おぉっと

>>292
>>291 に引用した原文を貼って来ればいいんですかね?
0296名無し編集部員2013/06/11(火) 19:24:57.11ID:q3Iycy0E
修正したんでね?
それが登録される要素は無い感じだからミスしてただけかと
0297名無し編集部員2013/06/11(火) 19:30:50.05ID:q3Iycy0E
将来的には登録者が検索できるようなシステムがあればいいと思います
>>98みたいなことが簡単にできるよう、文言をコピペすると何が登録されたワードと一致するのかがわかるように
報告スレを作った際の重複チェックにも使える
0298名無し編集部員2013/06/11(火) 19:34:04.81ID:F/25QO6h
>>296
個別の商品紹介ページだとポイントアフィリエイト付きURLにできるからじゃないか?
って>>293のスレとかでウワサされていたけど
ホワイトリスト登録が入ったのかな?
それとも>>290の再修正?
0300Apparently admin ★2013/06/11(火) 20:13:01.92ID:???
>>299
Thank you for your submission. By the way, this is not the bad url submission
thread, but I am happy people are talking on it. Probably, should be talking
in Japanese on it.
0301名無し編集部員2013/06/11(火) 20:19:01.42ID:beIsb8Gz
>>300
レスありがとうございます
より多くのスパムがこの機能で削除されることを願っています
0302Jack ★2013/06/11(火) 20:21:42.98ID:???
>>295
もしかしたら、>>296さんの書いているように修正されたのかもですね

>>297
鯔は検索や修正が出来るようにしなければですね
ただ、公開するとギリギリを狙う人が出てくるので、非公開で運用するでしょう
0304名無し編集部員2013/06/11(火) 20:31:27.33ID:DSAHy8Lb
もちろん非公開でいいのですが、データの側でも登録した人や最終更新した人やその日時がわかるといいですね
0305Apparently admin ★2013/06/11(火) 20:31:49.08ID:???
>>291
すみーません、わからない
0306名無し編集部員2013/06/11(火) 20:39:31.11ID:q3Iycy0E
>>303
登録後の書き込みで無くliveなスレッド全て検索して消し去るのか
こりゃ登録日時後の書き込みのみ適用に修正した方がいいと思うよ
0307名無し編集部員2013/06/11(火) 20:40:08.91ID:2TpiAKeL
いつごろ全板適用になりそうですか?過激な恋愛板なんですが
一日あたり100件近い出会い系スパムがある状況です。
0308名無し編集部員2013/06/11(火) 20:45:06.94ID:F/25QO6h
>>305
>>302で話をしてるツールができるまではキーワードの特定が難しいのかな
わざわざありがとうございました
0310Jack ★2013/06/11(火) 20:58:46.18ID:???
ん〜、Rock54と違って一発削除というのはやっぱり難しいなぁ
スパムに相当するURLであったとしても、以下のようなPOSTは削除に値するのでしょうかねぇ
----------
↓のようなURLって踏むと危ないよね
http://xxxxxxxx.net/abunai/
----------

Jimさんはかなり走っていますけれども、いいのかなぁ
なんか、頭痛いです。
0311名無し編集部員2013/06/11(火) 21:01:19.07ID:2TpiAKeL
>>309
種類で言えばこれぐらい?他の板では自動削除されているのも
あるようなので、過激板は未適用なのかなと。
http://pele.bbspink.com/test/read.cgi/kageki/1152324469/724
http://pele.bbspink.com/test/read.cgi/kageki/1366348720/835
http://pele.bbspink.com/test/read.cgi/kageki/1368262356/378
http://pele.bbspink.com/test/read.cgi/kageki/1366466715/789
http://pele.bbspink.com/test/read.cgi/kageki/1332650200/234
http://pele.bbspink.com/test/read.cgi/kageki/1368262356/382
0312名無し編集部員2013/06/11(火) 21:03:12.98ID:F/25QO6h
>>291の削除が発動しました
>>303もヘッドラインが溜まったら発動するんだろうか?
0313Jack ★2013/06/11(火) 21:08:50.44ID:???
>>Jim-san

It is not good to work the new system with all the boards. Because, that is still defective.
Probably, we need much more tests.
I want you to use the new system only with the following two boards.
That is the bbbb board and meow board.
I would like to respect many people's important POST.

おねがいします。
03163032013/06/11(火) 21:31:51.03ID:lvz/BDpc
自分の主観ですが、げっちゅ屋は二次ソースとして利用するほかに、体験版やデモムービー等の
ダウンロードサイトでもあり、げっちゅ屋のURLが含んでいるレスを無差別に削除されると
結構困ります
0317名無し編集部員2013/06/11(火) 21:32:04.12ID:q3Iycy0E
>>313
機能的には上手く動いてるし、リストが非公開なら外部の人間は確認しようもない
これだって通販サイトのURLを解除すれば済む問題なわけでして
テストというよりポリシーの問題のような…
0318名無し編集部員2013/06/11(火) 21:35:31.87ID:YCRQyYcZ
>>269 の件は、ログ掘ってアクセス規制はできないのでしょうか?
PINKではそもそもアクセス規制しない方針なんでしょうか?
0320名無し編集部員2013/06/11(火) 21:43:47.27ID:YCRQyYcZ
>>319
誘導ありがとうございます。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況