Discussion
Loading...

Post

  • About
  • Code of conduct
  • Privacy
  • Users
  • Instances
  • About Bonfire
spla
@spla@mastodont.cat  ·  activity timestamp 2 months ago

Al bot de #Amazon no li preocupa gens que l'estigui bloquejant en cada intent que fa, ell segueix al mateix ritme.

Edito: necessitava temps per veure que era a la llista de robots.txt, ja fa un parell de dies que no xafardeja res.

#scraping #BotsXafarders

gràfica on es mostren els intents del bot de Amazon per xafardejar tuts, etiquetes, enllaços etc
gràfica on es mostren els intents del bot de Amazon per xafardejar tuts, etiquetes, enllaços etc
gràfica on es mostren els intents del bot de Amazon per xafardejar tuts, etiquetes, enllaços etc
  • Copy link
  • Flag this post
  • Block
Mestretites
@mestretites@mastodont.cat replied  ·  activity timestamp 2 months ago
@spla tens alguna documentació de com muntat el sistema? M'agrada entendre com parar al Mal (no parlo de tu 😉)
  • Copy link
  • Flag this comment
  • Block
spla
@spla@mastodont.cat replied  ·  activity timestamp 2 months ago
@mestretites no l'ha he fet, hauria de publicar-ho. En resum, es basa en afegir una configuració a nginx on es llisten els user_agent dels robots coneguts i retornar-lis el codi d'estat 444.
Un cop tens això actiu, amb l'ajut de Loki, Promtail i Grafana obtens del log els robots rebutjats amb 444 i generes el gràfic.
server {
listen 443 ssl http2;
listen [::]1:443 ssl http2;
server_name mastodont.cat;
# Block requests from flagged AI bots
if ($block_ai_bot) {
return 444;
}
server { listen 443 ssl http2; listen [::]1:443 ssl http2; server_name mastodont.cat; # Block requests from flagged AI bots if ($block_ai_bot) { return 444; }
server { listen 443 ssl http2; listen [::]1:443 ssl http2; server_name mastodont.cat; # Block requests from flagged AI bots if ($block_ai_bot) { return 444; }
# Define a map to check the User-Agent header for known AI bots.
map $http_user_agent $block_ai_bot {
default 0;
# List of AI bot patterns (case-insensitive match)
~kaiHitBot 1;
~kAnthropicAl 1;
~x0penAl 1;
~%xSogou 1;
~xAhrefsBot 1;
~xSemrushBot 1;
~kxia_archiver 1;
~xAI2Bot 1;
~%Ai2Bot-Dolma 1;
~xAmazonbot 1;
~kanthropic-ai 1;
~%Applebot 1;
~xApplebot-Extended 1;
~xAwarioBot 1;
~xAwarioRssBot 1;
~xAwarioSmartBot 1;
~ ~%Bytespider 1;
# Define a map to check the User-Agent header for known AI bots. map $http_user_agent $block_ai_bot { default 0; # List of AI bot patterns (case-insensitive match) ~kaiHitBot 1; ~kAnthropicAl 1; ~x0penAl 1; ~%xSogou 1; ~xAhrefsBot 1; ~xSemrushBot 1; ~kxia_archiver 1; ~xAI2Bot 1; ~%Ai2Bot-Dolma 1; ~xAmazonbot 1; ~kanthropic-ai 1; ~%Applebot 1; ~xApplebot-Extended 1; ~xAwarioBot 1; ~xAwarioRssBot 1; ~xAwarioSmartBot 1; ~ ~%Bytespider 1;
# Define a map to check the User-Agent header for known AI bots. map $http_user_agent $block_ai_bot { default 0; # List of AI bot patterns (case-insensitive match) ~kaiHitBot 1; ~kAnthropicAl 1; ~x0penAl 1; ~%xSogou 1; ~xAhrefsBot 1; ~xSemrushBot 1; ~kxia_archiver 1; ~xAI2Bot 1; ~%Ai2Bot-Dolma 1; ~xAmazonbot 1; ~kanthropic-ai 1; ~%Applebot 1; ~xApplebot-Extended 1; ~xAwarioBot 1; ~xAwarioRssBot 1; ~xAwarioSmartBot 1; ~ ~%Bytespider 1;
  • Copy link
  • Flag this comment
  • Block
jolupa :fedora: :gnome: i :fcknzs:
@jolupa@misskey.canpavon.cat replied  ·  activity timestamp 2 months ago

@spla@mastodont.cat potser la zipbomb que deien no fa gaire és l'única manera de parar aquest sense sentit...

  • Copy link
  • Flag this comment
  • Block
La Pesanta
@lapesanta@mastodont.cat replied  ·  activity timestamp 2 months ago
@spla És una situació insostenible, on es malbaraten recursos a tort i a dret.
  • Copy link
  • Flag this comment
  • Block
jordi
@xorsch@mastodont.cat replied  ·  activity timestamp 2 months ago
@spla

Sols no podrem fer-hi front, però els que ens agrada la informàtica haurem de buscar tècniques per defensar-nos.

Jo ho dic en serio: entre el Intel Me, o PSP d'AMD, el control de las claus UEFI per part de microsoft, etc ... No vull saber que faràn ara que disposen de hardware dedicats a poder perfilar l'usuari amb les npu ..

Ja veurem quines salvatjades fan.

  • Copy link
  • Flag this comment
  • Block
spla
@spla@mastodont.cat replied  ·  activity timestamp 2 months ago
@xorsch tristament cert, a la immensa majoria de la gent no els interessa gens, si és que en tenen coneixement.
  • Copy link
  • Flag this comment
  • Block
spla
@spla@mastodont.cat replied  ·  activity timestamp 2 months ago

@xorsch intento llegir el necessari per a que el servidor funcioni bé per a tots vosaltres. També és cert que m'agrada força la informàtica, diria que des de sempre.
Parlant amb altres admins no tothom pensa igual, hi ha qui diu que és una guerra perduda, que Amazon té milers de IPs, que poden canviar els user_agent dels seus bots, etc. Jo no puc estar sense fer res, no m'agrada deixar que agafin el que vulguin.
Sí que estaria bé fer un paper però imagino que en deuen haver per internet...

  • Copy link
  • Flag this comment
  • Block
Log in

bonfire.cafe

A space for Bonfire maintainers and contributors to communicate

bonfire.cafe: About · Code of conduct · Privacy · Users · Instances
Bonfire social · 1.0.0-rc.3.13 no JS en
Automatic federation enabled
  • Explore
  • About
  • Members
  • Code of Conduct
Home
Login