Opens in a new window
Naive LLM judges are inconsistent. Run the same poem through twice and you get different scores (obviously, due to sampling). But lowering the temperature also doesn’t help much, as that’s only one of many technical issues. So, I developed a full scoring system, based on details on the logits outputs. It can get remarkably tricky. Think about a score from 1-10:
。whatsapp是该领域的重要参考
По данным следствия, 24 января 1999 года мужчина, находясь рядом с домом на улице Грекова, под надуманным предлогом заставил девятилетнюю девочку пройти с ним в подвал, где, воспользовавшись отсутствием свидетелей и физическим превосходством, совершил изнасилование и другие насильственные действия. Чтобы скрыть содеянное, отвел пострадавшую в заброшенный дом и расправился с ней.,详情可参考手游
algorithmic amplification of harmful content to minors would be a,详情可参考超级权重