Filter
Exclude
Time range
-
Near
Replying to @jumperz
Different model as the red-team judge is the move — independence is the mechanism. The overblocking you hit is the tell: a paper this month found the critic role is exactly where confidence is least diagnostic (AUROC 0.63 vs 0.80). Weight what it flags, not how sure it sounds.
257
Replying to @flochen_
In der Praxis haben NetzDG und DSA zu overblocking geführt. Lieber als Plattform auch unterhalb der Strafbarkeitsgrenze zensieren, als staatliche Sanktionen zu riskieren. Für den Bürger defacto Freiheitseinschränkung.
4
49
Anthropic launched Claude Fable 5, a new Mythos-class AI model positioned as its most advanced general-purpose system, claiming state-of-the-art performance across most benchmarks, including software engineering, knowledge work, vision, and scientific research, with stronger gains on more complex tasks. The release introduces new safety systems that route certain sensitive queries to Claude Opus 4.8, activating in under 5% of sessions, though with some acknowledged overblocking of benign prompts as part of a conservative rollout. Anthropic also introduced Claude Mythos 5 for trusted partners, using the same base model with relaxed safeguards for select cybersecurity and research use cases, initially deployed through the Glasswing program with the U.S. government. Both models are priced at $10 per million input tokens and $50 per million output tokens, below prior versions. $ANTHZZX.P
529
Replying to @MarcelVelica
Pretty much that balance. xBPP sets the guardrails before execution, Veil records the outcome after. You need both or you end up either overblocking or flying blind.
1
44
2017 / NetzDG: Zensur per Algorithmus Plattformen müssen „offensichtlich illegale" Inhalte binnen 24 Stunden löschen, sonst bis zu 50 Mio. Euro Strafe. Ergebnis: massenhaftes Overblocking, weil kein Unternehmen das Risiko eingeht. Wer entscheidet, was illegal ist? Nicht ein Richter. Der Konzern selbst, der gleichzeitig Partei ist. (10/11)
1
5
84
Und das bei den ohnehin schon sehr weitreichenden Beschränkungen der Meinungsfreiheit durch DSA, trusted flagger, NetzDG, reguläre Strafverfolgung, eigene Nutzungsbedingungen (AGB) der Plattformen und richterliche AGB-Kontrolle. Nötig und vollkommen ausreichend sind nur die letzten drei, die staatliche Kontrolle auf das strafrechtliche Minimum reduzieren und die Selbstkontrolle per Vertragsrecht unterstützen. Vor wenigen Jahren beklagte man noch die Gefahr des Overblocking durch die Plattformen aufgrund ihrer eigenen Nutzungsbedingungen. Per richterlicher AGB-Kontrolle konnte dem noch etwas entgegengesetzt werden und es etablierte sich eine durchaus funktionierende Rechtsprechung bis hin zum BGH. Der Trick ist nun (auch schon beim DSA), dass der Staat gleichsam die Nutzungsbedingungen/AGB als zwingenden Inhalt diktiert, so dass dann auch die richterliche AGB-Kontrolle versagt. Denn dann entspricht der AGB-Inhalt dem gesetzlichen Leitbild. Das alles ist extrem heimtückisch und muss verhindert werden.
3
2
12
475
Replying to @thedark92207195
Plattformhaftung ist genau das, was zu Overblocking führt. Soll die Post haften für böse Briefe?
1
9
114
Das sieht bei uns leider genauso aus. Die @mazluzern will die Altmedien vor Overblocking durch die Plattformregulierung (#KomPG) schützen, während wir diesen Schutz vor Zensur nicht erhalten sollen.
This tweet is unavailable
2
5
13
718
🧐 Risco à liberdade de expressão Decretos de Lula consolidam lógica de censura do STF e ameaçam eleições Leonardo Desideri, Gazeta do Povo (21/05/2026) Decretos assinados por Lula consolidam lógica de censura do STF e ameaçam as eleições de 2026. Os decretos publicados pelo governo Lula nesta quinta-feira (21) transformam em regra a mudança feita pelo Supremo Tribunal Federal no Marco Civil da Internet, em 2025, e levam para dentro do Executivo a fiscalização de deveres de moderação de conteúdo que a Corte previu para as redes sociais. Em junho do ano passado, o STF colocou uma coleira jurídica nas plataformas digitais ao derrubar a exigência de ordem judicial para responsabilizá-las por publicações de terceiros. A decisão abriu caminho para uma lógica de pressão sobre as redes: se não retirarem do ar conteúdos considerados ilícitos, como "discurso antidemocrático", poderão ser responsabilizadas. Com os decretos publicados nesta quinta, o governo Lula puxou essa lógica para dentro do Executivo, montando uma estrutura administrativa para fiscalizar e punir a moderação feita pelas empresas, que pode começar a funcionar em pleno ano eleitoral. Juristas apontam um risco para as eleições de 2026, já que uma agência vinculada ao Executivo passará a fiscalizar regras que podem afetar diretamente o debate público nas plataformas digitais. O presidente Lula é provável candidato à reeleição. Os decretos entram em vigor 60 dias após a publicação, ou seja, perto do auge da disputa eleitoral. O centro da mudança está no papel da ANPD (Autoridade Nacional de Proteção de Dados), criada originalmente para atuar na proteção de dados pessoais. Pelo novo decreto, a agência passa a regular e apurar infrações relacionadas aos direitos dos usuários e ao cumprimento dos deveres das plataformas, incluindo moderação de conteúdo, canais de denúncia, anúncios, impulsionamentos pagos, relatórios de transparência, redes artificiais e riscos sistêmicos. A professora de Direito Eleitoral Francieli Campos, especialista em inteligência artificial pela Universidade de Salamanca, afirma que o governo transformou a ANPD, por decreto, em uma espécie de agência reguladora do conteúdo das redes, sem que o Congresso tenha deliberado sobre o assunto. Ela destaca que a ANPD foi criada pela LGPD (Lei Geral de Proteção de Dados Pessoais) "com a competência estrita de zelar pela proteção de dados pessoais". "O governo, por meio de decreto, tentou transformar a ANPD em uma 'agência reguladora de conteúdo digital', algo que o Congresso Nacional exaustivamente debateu e não aprovou no chamado PL das Fake News, o PL 2630. Expandir a competência de uma autarquia para fiscalizar a moderação de discursos e redes artificiais sem uma lei que altere a sua estrutura original é um claro excesso do poder regulamentar", afirma. Para o ex-juiz de direito Adriano Soares da Costa, especialista em Direito Eleitoral, o problema é agravado pelo momento da medida. Segundo ele, o Executivo passa a exercer, em ano eleitoral, um poder capaz de interferir no discurso público, com risco evidente de abuso de poder político e de usurpação de competências do Tribunal Superior Eleitoral (TSE). "Este decreto, em vigor este ano, poderá inclusive ferir, por via oblíqua, indireta, a legislação eleitoral e a anualidade eleitoral. Então, o Tribunal Superior Eleitoral terá que se pronunciar, se os partidos provocarem, porque isso de fato pode trazer um desequilíbrio ao pleito", diz. Os dois decretos abordam temas distintos. O decreto nº 12.975 atualiza a regulamentação do Marco Civil da Internet e cria a lógica da fiscalização das plataformas, com regras sobre notificações extrajudiciais, dever de cuidado, falha sistêmica, redes artificiais, anúncios, impulsionamentos pagos e envio de informações ao poder público.Já o decreto nº 12.976 aplica a mesma lógica ao tema da violência contra mulheres no ambiente digital, com prazos próprios de remoção, retirada de conteúdo íntimo sem autorização em até duas horas e redução de alcance de ataques coordenados contra mulheres. O primeiro decreto, que altera a regulamentação do Marco Civil da Internet, se apoia em conceitos abertos que deixam larga margem de interpretação às autoridades encarregadas da fiscalização. O principal deles é o de "falha sistêmica". Pelo texto, as plataformas poderão ser enquadradas nessa categoria se não comprovarem a adoção de medidas consideradas adequadas para prevenir ou remover determinados conteúdos ilícitos e impedir sua circulação massiva. A lista de ilícitos combina crimes cuja definição tende a ser mais objetiva, como terrorismo, crimes sexuais contra vulneráveis e tráfico de pessoas, com categorias bem mais abertas, como os crimes contra o Estado Democrático de Direito. Isso aumenta o peso da interpretação das plataformas e da autoridade fiscalizadora sobre o que deve ser removido. No caso das plataformas, o risco, como apontam juristas consultados pela Gazeta do Povo, é de "overblocking" (bloqueio excessivo): diante da possibilidade de punição, as plataformas tenderão a remover mais conteúdos do que o necessário, inclusive publicações lícitas que fiquem em zonas cinzentas. A avaliação da "falha sistêmica" caberá à ANPD, que fará supervisão e análise periódica. O texto afirma que a existência de conteúdos ilícitos isolados não vai caracterizar, por si só, falha sistêmica. Francieli afirma que essa estrutura "desborda do que foi deliberado pelo Supremo Tribunal Federal no julgamento sobre a parcial inconstitucionalidade do artigo 19 do Marco Civil da Internet". "Embora os ministros da Corte tenham citado a ANPD em seus debates como um corpo técnico qualificado para zelar pela governança procedimental e transparência das plataformas, o acórdão focou estritamente no regime de responsabilidade civil judicial e na mitigação de danos. O STF não chancelou a instituição de um mecanismo de supervisão contínua e periódica pelo Poder Executivo sobre o debate público virtual. Ao contrário, o tribunal pressupôs que os limites da atuação administrativa respeitariam as competências já existentes, sem autorizar a conversão de uma autarquia técnica em um provável censor administrativo de conteúdos", explica. A jurista sustenta que a competência da ANPD é delimitada pela Lei Geral de Proteção de Dados e pelo ECA Digital, que atribuiu à agência funções específicas na proteção de crianças e adolescentes no ambiente virtual. Para ela, o Executivo não poderia usar decreto regulamentar para ampliar a jurisdição da autarquia. "Como o chefe do Executivo não pode, por meio de um decreto regulamentar de caráter estritamente executivo, ampliar a jurisdição de uma autarquia para abarcar matérias penais, institucionais e de riscos sistêmicos globais, temas que dependem de lei formal e que o Congresso Nacional optou por não converter em texto legal, o ato normativo, me parece, incorreu em claro excesso do poder regulamentar", observa. O segundo decreto publicado pelo governo trata da proteção de mulheres na internet. O texto, bastante aberto em alguns trechos, define a violência contra mulheres em ambiente digital como "conduta ou omissão que cause morte, dano ou sofrimento físico, sexual, psicológico, político ou econômico, inclusive dano patrimonial, em qualquer esfera de suas vidas, cometido, instigado, facilitado ou agravado, total ou parcialmente, pelo uso de tecnologias digitais". Ao considerar até mesmo uma omissão que cause sofrimento psicológico como "violência", o decreto abre margem para que as plataformas se sintam obrigadas a remover, por exemplo, uma onda de críticas legítimas contra uma parlamentar mulher que eventualmente pudesse alegar sofrimento psicológico. O decreto prevê que plataformas serão responsabilizadas em caso de falha sistêmica na remoção imediata de conteúdos que configurem crimes ou atos ilícitos contra mulheres. Assim como no decreto geral, haverá falha sistêmica quando a plataforma não comprovar medidas adequadas de prevenção ou remoção capazes de inibir a circulação massiva desses conteúdos. O artigo 8º determina que plataformas adotem medidas para reduzir o alcance e a visibilidade de "ataques coordenados" contra mulheres. A regra obriga o provedor a agir independentemente de notificação ou denúncia prévia da vítima. O texto diz que todas essas medidas deverão ser adotadas "em regime prioritário" nos casos de violência política contra a mulher ou quando a vítima for mulher com exposição pública decorrente de sua atuação profissional, "como profissionais da imprensa".
22
52
809
Overblocking is a security failure too.
Anthropic's terrible safety situation is making it so that I cannot have Opus review p0 issues in Hermes Agent to review and help fix security issues. This does nothing but give hackers an asymmetric advantage over everyone - they will find jailbreaks, they will find ways around this to exploit systems - and the rest of us are locked out of using AI to protect from them. What a joke
2
230
Replying to @gray_bling
That’s the core problem. Agents already execute well. What’s missing is a consistent way to decide when they shouldn’t. ESCALATE matters because it prevents forced decisions in uncertain cases. No blind execution, no overblocking.
1
19
با توجه به رأی اخیر صادرشده در پرونده شکایت صداوسیما از آپارات و محکومیت چند هزار میلیارد تومانی این پلتفرم، که زومیت درباره آن گزارش داده است: zoomit.ir/iran-news/459690-a… به نظر می‌رسد یکی از مهم‌ترین چالش‌های حقوق فناوری در ایران، هنوز تعیین مرز مسئولیت پلتفرم و مسئولیت کاربر است. اگر دادگاه‌ها به سمت مسئولیت مطلق پلتفرم‌ها بابت تمام محتوای کاربران حرکت کنند، چند پیامد جدی ایجاد خواهد شد: عملاً مدل پلتفرم کاربرمحور (UGC) در ایران بسیار پرریسک می‌شود ، چون هیچ پلتفرمی امکان بررسی کامل و پیشینی همه محتوای کاربران را ندارد. نتیجه طبیعی چنین وضعی، افزایش شدید سانسور و overblocking خواهد بود، یعنی پلتفرم‌ها برای فرار از مسئولیت، هر محتوای مشکوکی را حذف می‌کنند. در عمل فقط بازیگران شبه‌انحصاری یا برخوردار از حمایت‌های حاکمیتی توان ادامه فعالیت خواهند داشت، چون هزینه‌های حقوقی، فنی و ریسک فعالیت برای سایرین بسیار سنگین می‌شود. نوآوری در اقتصاد محتوا و حوزه پلتفرم‌های داخلی آسیب می‌بیند و طبیعتاً این وضعیت می‌تواند به مهاجرت بیشتر کاربران و تولیدکنندگان محتوا به سمت پلتفرم‌های خارجی منجر شود، در حالی که اگر هدف، تقویت زیست‌بوم داخلی و جلوگیری از وابستگی بیشتر به پلتفرم‌های خارجی است، باید محیط حقوقی قابل پیش‌بینی‌تری برای پلتفرم‌های داخلی ایجاد شود. در مقابل، روشن است که پلتفرم‌ها نیز نمی‌توانند هیچ مسئولیتی نداشته باشند. به نظر می‌رسد مدل متعادل‌تر آن است که: مسئولیت اولیه متوجه کاربر منتشرکننده محتوا باشد، اما اگر پلتفرم پس از اخطار معتبر اقدام مؤثر انجام ندهد یا عامدانه نقض گسترده حقوق را تسهیل کند، مسئولیت ثانویه برای آن ایجاد شود. چنین مدلی به استانداردهای پذیرفته‌شده جهانی در حوزه مسئولیت پلتفرم‌ها نیز نزدیک‌تر است.
4
3
25
1,236
Consequences of your actions: when META estimates (!) age based on A.I., *parents* have NO chance to decide themselves for their children. Even supervised accounts will be blocked! Overblocking will necessarily come! You are destroying the EU!
2
88
Utah just made websites liable for users who use VPNs. You can’t ban VPNs without becoming China. So the choices are overblocking… or draconian surveillance.
56
167
982
18,005
I mean they are getting sued left and right, but yeah they too incompetent to implement real safeguards without overblocking
1
2
21
Weil Reichweite und Sichtbarkeit gerade ein Thema sind, habe ich @grok gefragt. Auswirkungen auf Nutzer: X entfernt oder beschränkt Inhalte nur für EU-Nutzer (#GeoBlocking), um rechtlich konform zu sein – weltweit bleibt vieles sichtbar. Es gibt #Overblocking: Automatische Filter (auch zu Emojis als „Dogwhistles“) und Druck durch „#TrustedFlaggers“ führen dazu, dass legale, aber kontroverse Posts (z. B. zu Migration, Politik) vorsorglich gelöscht oder gedrosselt werden.
2
1
2
107
Típico de Autocracias Eleitorais e fechadas: STF abre licitação para patrulhar redes sociais. Edital prevê acompanhamento 24hs por dia de menções ao tribunal e seus ministros, c envio de alertas em tempo real e relatórios analíticos. O nome disso é: censura e intimidação, cerceamento da liberdade de expressão, ativismo judicial, overblocking, abuso de autoridade, cyberstalking (Perseguição Digital).
Esses ministros NÃO IRÃO RECUAR. Se o fizerem, podem abrir espaço para processos de impeachment e eventual responsabilização por possíveis crimes. Estão no modo sobrevivência, irão endurecer as posições e adotar decisões cada vez mais concentradoras de poder e ditatoriais.
2
6
85
Replying to @victoranicio
300mil reais para STF perseguir o cidadão. Típico de Autocracias Eleitorais e fechadas: STF abre licitação para patrulhar redes sociais. Edital prevê acompanhamento 24hs por dia de menções ao tribunal e seus ministros, c envio de alertas em tempo real e relatórios analíticos. O nome disso é: censura e intimidação, cerceamento da liberdade de expressão, ativismo judicial, overblocking, abuso de autoridade, cyberstalking (Perseguição Digital).
1
3
40
Replying to @Cointelegraph
interesting move feels like x is trying to preempt scams at the source rather than react after damage is done. curious how they’ll define “crypto content” without overblocking legit users.
2
494