Local AI 集中討論區 (1) - 我覺得SeedVR2.5仲爆過Deepseek

Peach · 2026-04-06T16:51:20.5270000Z

正式開個post集中討論本地部署AI內容不限，可以Image、Video、Audio、LLM、etc...前提係要有方法Local行到之前舊Post我覺得WAN 2.2仲爆過Deepseek，但冇乜人提https://forum.hkgolden.com/thread/7991628我覺得WAN 2.1仲爆過Deepseek，但冇乜人提https://forum.hkgolden.com/thread/7927596話說SeedVR2.5都已經出左5個月但我岩岩先Down左官方個workflow黎玩 https://civitai.com/models/1769163orhttps://github.com/numz/ComfyUI-SeedVR2_VideoUpscaler(civitai果個一好樣，只係佢岩岩先放2.5係civitai )乜都冇拎改直接拎左條陳年3gp，結果一出效果真係俾佢嚇親你可能話，好似都唔係好勁ja wor，仲係鬆郁朦勁唔勁係要睇埋原片係咩料先原片得176x144再拉伸到4:3，仲要起拎晒格 (上面gif未做返4:3拉伸)如果咁都唔勁你都係出返去啦 AI真係好廢，浪費地球資源暫時I2V好似冇乜突破性新野 (有既話我知 )得閒先再試下LTX 2.3

現有會員可[按此]登入。未成為會員可[按此]註冊。
[公司模式 - 關] [懷舊模式 - 開]
[Youtube 預覽 - 關] [大字型] [小字型]

您現在聚腳在 AI技術台內。

高登討論區 HKGolden

高登新聞部

高登主頁 » 討論區 » AI技術台

發表回覆

跳至第頁

發起人

Local AI 集中討論區 (1) - 我覺得SeedVR2.5仲爆過Deepseek

52 個回應

淋病越傻豬

[video]https://upload.hkgolden.media/comment/d2bfaj1g.cdi5ky1yln0.ubl0425mz3s.0ac.webm?id=1154074[/video]
高登update左有得up片

咩嚟？

留名投訴文章快速引用引用原文 12/4/2026 00:27

河北採花賊

樓主部腦咩配置？

留名投訴文章快速引用引用原文 12/4/2026 00:31

Peach

[video]https://upload.hkgolden.media/comment/d2bfaj1g.cdi5ky1yln0.ubl0425mz3s.0ac.webm?id=1154074[/video]
高登update左有得up片

咩嚟？

80年代Anal Lo

留名投訴文章快速引用引用原文 12/4/2026 00:45

Peach

樓主部腦咩配置？

4090

留名投訴文章快速引用引用原文 12/4/2026 00:45

Peach

之前用WAN SVI都係玩2D，所以冇留意
轉gen 3D CG，發現用左SVI後畫質會劣左(texture detail劣左好多)
可能係lightspeed model先會
但轉用非lightspeed model + lightspeed lora都係咁
就算加到8step都係同4step一好樣
冇理由唔行lightspeed而行20 step+，咁樣慢到接受唔到，所以冇試 [sosad]

3D CG黎講LTX畫汁明顯靚過WAN SVI
唔用SVI就大家差唔多，但用舊方法駁片5秒後就會劣 :~(

留名投訴文章快速引用引用原文 12/4/2026 04:13

Peach

繼續試LTX 2.3
發現First Pass sampler較euler
好似解決到慢動作問題
要再試多的睇睇
原本個euler_ancestral_cfg_pp我睇落就有delay
例如prompt寫晒幾秒幾秒做的咩，10秒內容用euler_ancestral_cfg_pp可能做到5秒就完左 [sosad]

試圖

https://upload.hkgolden.media/comment/4crj0d0n.o12pmdizgi1.natrscgx42p.5z0.jpg

之前用euler_ancestral_cfg_pp整左比較好既片
[video]https://upload.hkgolden.media/comment/wnjrpdv4.ezlarksbmsw.b4mlhxvxvtu.kfj.webm?id=1154318[/video]
呢個用euler整，prompt唔同，用相同prompt+euler_ancestral_cfg_pp整果條太跳脫cancel左 [sosad]

[video]https://upload.hkgolden.media/comment/ai02gsvs.1jj2dh5j2us.rtq2iskgez1.d05.webm?id=1154324[/video]

呢條NSFW用相同seed+prompt整，個速度分別一目了然
euler_ancestral_cfg_pp
[video]https://upload.hkgolden.media/comment/jtamw5cp.sqrjvv4umxv.iz2px4zdrvt.2oh.webm?id=1154325[/video]
euler
[video]https://upload.hkgolden.media/comment/zoma0r3o.yaobmlmzx4j.hbhosww3d5f.nmp.webm?id=1154326[/video]

留名投訴文章快速引用引用原文 12/4/2026 12:42

Peach

This one

https://upload.hkgolden.media/comment/s0nn22te.gl2mv22chcm.j3edjlnsgxq.p5t.png

留名投訴文章快速引用引用原文 12/4/2026 12:45

Relativity

喂啊

留名投訴文章快速引用引用原文 12/4/2026 14:59

Peach

LTX2.3建議用RuneXX個workflow
佢呢個workflow跟prompt跟得好好多 (雖然都係做唔到我想做既野 [sosad]

)
我用Basic同冇用佢個Prompt Enhancer
我睇返最主要分別應該係
text encoder用左
gemma_3_12B_it_fpmixed
同加左LTX2 NAG

之前既wf如果淨改用gemma_3_12B_it_fpmixed都一樣可以跟prompt好的
再加埋LTX2 NAG可能效果就一樣了(唔試了)
我用RuneXX果個加返1st pass video preview算
夠簡潔
除左個Prompt Enhancer冇多餘野 #good#

留名投訴文章快速引用引用原文 14/4/2026 03:46

巧仁

長D ok

留名投訴文章快速引用引用原文 14/4/2026 05:29

Peach

長D ok

邊條長D?

留名投訴文章快速引用引用原文 14/4/2026 08:18

Peach

有新方法
用WAN2.2先gen一條低res岩樣岩動作既片 (低res gen快超過1倍)
然後將條片用LTX2.3做upscale (Final Pass)
岩岩試，暫時畫汁ok
要計下數究竟對比直接用WAN2.2 gen Hires係慢左定快左
如果相對快好多，應該可以轉用呢個方法 [sosad]

留名投訴文章快速引用引用原文 14/4/2026 08:47

Peach

試圖

https://upload.hkgolden.media/comment/0qt0wbie.o0mqywtlxic.kdbfp1m0pqk.sep.jpg

WAN 2.2 SVI 512x768 10s 16fps gen time ~9X秒
[video]https://upload.hkgolden.media/comment/l4orz3tx.wej54v2pihz.bdgreijw4cz.ivl.webm?id=1156334[/video]
Upscaled with LTX 2.3 (Final Pass) 1024x1536 10s 16fps (3 steps) gen time ~5X-8X秒唔改prompt / ~9X-11X秒有改prompt的話
[video]https://upload.hkgolden.media/comment/k2fagvl5.qir245woy1g.5lttx1e1p0k.adq.webm?id=1156335[/video]
WAN 2.2 SVI 960x1440 10s 16fps gen time ~41X秒 (我平時gen開的size)
[video]https://upload.hkgolden.media/comment/ec3d3jzu.vgwpuow0lvc.jc5lgghjfeg.1dp.webm?id=1156339[/video]

好處
1. WAN 2.2 Lowres生成速度快，可以當成係preview，結果好既先掉去LTX 2.3 upscale
2. 寫Prompt難度降低，WAN 2.2只需要簡單指示，就可以做到合理正常既動作，而且NSFW支援度高，現成loras豐富
3. 有聲！
4. 整體gen快左成倍

壞處
1. 可能出現唔應該出現既details (呢樣就算native LTX 2.3都有機會有，係佢upscale生details問題)
2. 原片如果gen得太勁(例如眼)，upscale會有較嚴重既問題
3. 手指比native WAN2.2/LTX 2.3都差左
4. resolution雖然係仲高左，但畫汁係比native WAN2.2 SVI差

因為今次試圖係直圖show 3/4身，所以較容易有隻眼pixel太少導致變朦問題
我平時都係gen橫圖show半身多，眼佔既pixel會多好多
所以眼朦問題應該冇今次試圖咁明顯
之後先再試
例如睇下lowres如果再gen大小小又會唔會好的咁
同埋好似有少少郁得快就會變朦 :~(

留名投訴文章快速引用引用原文 15/4/2026 07:17

Peach

加ltx-2-19b-ic-lora-detailer lora可以提升返畫質 #good#

(呢個lora冇/未有2.3版)
唔計本身lowres gen得差朦到救唔倒，畫汁係好過WAN SVI

[video]https://upload.hkgolden.media/comment/esgkuefz.30sz2l5b2tl.vr5b0vyuum0.s0t.webm?id=1156351[/video]

留名投訴文章快速引用引用原文 15/4/2026 07:55

Relativity

樓主用咩display card #adore#

留名投訴文章快速引用引用原文 15/4/2026 08:30

七海麻美

咁搞法真係整一套av出來都得 #oh#

留名投訴文章快速引用引用原文 15/4/2026 08:30

Relativity

樓主用咩display card

睇到了 4090

留名投訴文章快速引用引用原文 15/4/2026 20:14

小馬蛇後援會

冇咩跟開
想問下依家即時換頭最勁係用邊個framework?

留名投訴文章快速引用引用原文 15/4/2026 20:16

Peach

冇咩跟開
想問下依家即時換頭最勁係用邊個framework?

我都冇跟開
你真係要「即時」近期應該係Deep-Live-Cam
但換臉技術好似冇突破 (我見都係用果的model，低炒果的效果都係麻麻)
你唔係玩live cam建議你用其他，界面會友善的
例如
comfyui-reactor-node
VisoMaster (獨立運作)
FaceFusion (獨立運作)

呢的一般有nsfw protection，有需要自己搵點解啦

你唔需要即時，而係想要效果靚
建議你搵返5-6年果的deepfake (eg DeepFaceLab)
呢的換臉效果先係堅野 #good#

留名投訴文章快速引用引用原文 16/4/2026 01:25

Peach

再試WAN2.2 upscale with LTX 2.3
今次幾肯定係動作快(變化大)會炒，而唔係原圖pixel少會炒
同埋試左好多次LTX粒lin都係畫得唔好 xx(

就算加左nude body用既lora都係咁
如果1st frame本身有lin俾佢參考就ok既

nsfw
WAN 2.2 768x512
[video]https://upload.hkgolden.media/comment/culy3tzv.hjtcg0xnbjc.up4shthbaiw.iuo.webm?id=1156977[/video]https://upload.hkgolden.media/comment/culy3tzv.hjtcg0xnbjc.up4shthbaiw.iuo.webm?id=1156977

upscale with LTX 2.3 1536x1024
[video]https://upload.hkgolden.media/comment/3iam1nck.j5l1jsmq4xv.s0fqcdb05fh.30b.webm?id=1156978[/video]https://upload.hkgolden.media/comment/3iam1nck.j5l1jsmq4xv.s0fqcdb05fh.30b.webm?id=1156978

高登有時會Load唔到片，貼埋link

雖然靜態畫汁同有聲真係正的，但動態效果真係麻麻
暫時都係等新版/其他方法算 :~(

留名投訴文章快速引用引用原文 16/4/2026 09:05

淋病越傻豬

勁！

留名投訴文章快速引用引用原文 16/4/2026 14:03

Peach

試緊Wan2GP
因為標榜低Ram用，所以之前冇用過
但見人話幾好用

暫時淨係試左WAN 2.2
佢個SVI 2 Pro畫汁緊正
用佢個Lightning i2v v2025-10-14 2 Phases - 4 Steps Preset
雖然相同resolution下比ComfyUI gen得慢
但畫汁最少贏一班(畫汁等同ComfyUI冇用SVI)
佢唯一問題係每5秒個畫面都會轉暗1次(畫汁冇變)
但唔見有人回報過呢個問題

研究係ComfyUI做返同一野，但發現佢個的model都係佢自己整，專for Wan2GP
SVI 2 Pro model係用int8
KJ話佢唔support int8 :~(

至於Wan2GP既SVI 2 Pro Enhanced Lightning v2
畫汁就同ComfyUI用SVI一樣咁勁
而佢gen速都係同SVI 2 Pro + Lightning Preset咁慢

之後試Wan2GP既LTX

留名投訴文章快速引用引用原文 19/4/2026 02:47

Peach

終於搵到WAN 2.2 upscale with LTX 2.3基本唔炒既方法
除左抖大氣果下郁得快的頭髮motion blur炒炒地之外，基本都冇炒 #good#

(就算Native LTX 2.3郁得快時效果其實都麻麻，尤其係手指)
但呢個真係純upscale，唔可以改變口型，直接加對白落去
只可以配合返個口型，所以我淨係叫佢加左的呼吸聲
同埋Step係8+3，遲下試下就咁3step效果點先 [sosad]

對比用WAN 2.2 SVI直接gen大長片
好處係用LTX 2.3做upscale，可以根據ref frame(1st frame)對原圖細節進行修復
特別係每5秒之後SVI都會出現各種劣化 (用SVI專用model會好少少)
所以為左畫汁提升，係值得咁做 (overall其實都係gen快左 [sosad]

)

同之前同一段nsfw
[video]https://upload.hkgolden.media/comment/b5vz2v3r.vqbafk0xjab.425h2oxkfaz.hiv.webm?id=1161109[/video]
https://upload.hkgolden.media/comment/b5vz2v3r.vqbafk0xjab.425h2oxkfaz.hiv.webm?id=1161109
ps 最後手指有錯

留名投訴文章快速引用引用原文 23/4/2026 00:54

Peach

發現WAN 2.2 upscale with LTX 2.3唔炒既秘密係在於fps
之前跟返原WAN 2.2 gen 16fps，所以會炒炒地
如果force rate set返原片做假24/25 fps (會用重複frame黎湊齊)
咁樣gen出黎就唔會炒
又可以改得返口型，同只係行3steps #good#