Skip to content

NoteNation-code

Published: at 10:25 AM

Session MongoDB

MongoDb atlast + extendtion vscode usecase TAXI check point fair price unfair price type geo map on mongodb bson b-tree indexing cach problem big arry loop เข้าไปให้ถึงและแปลง type long query

Unbounded Arry problem —> check point เท่าไหร่ไม่รู้จาก taxi

emmbered vs refernace

WOrk flow dev

การทำ planung and design conversation commit trigger deployment กด 80/20 collaboration meeting Diagram as a code DaaC https://diagrams.mingrammer.com/
experricne better AI

AI Safty 101

usecase buy stemps find solution search space

วิธีการที่ human จะสูญพัน
AI is an Agent AI ที่มี goal = agent

เราต้องสร้างบางอย่างที่ฉลาดกว่ามนุษย์ ไม่งั้นเราทำ automation ก็ได้

sandbox ให้มันทำอะไรบางอย่างในกรอบ LLM ตอบในสิ่งที่มนุดอยากได้แต่ limit  ไม่ให้พูดบางเรื่อง เราอยากได้ยินแต่ไม่ปลอดภัย

ขัดแย้ง …

fundamentally = goal ที่เราอยากได้ เราสร้างสิ่งฉลาดกว่าเรา แล้วเราจะคุมมันได้หรอ?????

aligement problem

Negativbr side Effect

เราอยากให้ทำบางอย่าง แต่ไปทำความชิบหายให้เรื่องอื่น

ทำอยากให้มัน Safty

มันเหมือนเรามีลูก สอนแบบเดียวกันแต่มันไม่ได้คิดเหมือนเรา

อย่าให้ มัน solve สิ่งที่เราไม่รู้ เพราะไม่รู้ว่ามันจะทำอะไร

reward hacking problem use case AI write code

ถ้าเราให้พลัง AI เยอะมันก็อาจจะทำสิ่งเป็นอันตรายได้

RLHF

ปกติเราให้ goal ตรงๆ reward function

กลายเป็นให้มันตอบมาแทน เรามนุดเราเรียก เราไม่ได้เขียน reward function ไป

เหมือนอยากให้ลูกเป็นหมอ ถ้าเป็นอย่างอื่น ก็ไม่เชีย มันเป็นการบอกอ่้อมที่ก็ยังมี reward function

KL divergen formular

Intrrumental COmnvergent

เหมือนมีเงินเยอะก็ไปหา goal ได้หมด

AI มันจะฉลาดจนไม่ยอมปิดตัวเองได้

​intervester ลงเงินไปเยอะ อยากได้กำไรจาก AI ยังไง

มีคนสรุปมาให้


Previous Post
DiaryCoding:CreateToolTesting
Next Post
Christian?