現有會員可[按此]登入。未成為會員可[按此]註冊。
[公司模式 - 關]  [懷舊模式 - 開
[Youtube 預覽 - 關]  [大字型]  [小字型]

您現在聚腳在 AI技術台內。

跳至第

發起人
Local AI 集中討論區 (1) - 我覺得SeedVR2.5仲爆過Deepseek
52 個回應
[video]https://upload.hkgolden.media/comment/d2bfaj1g.cdi5ky1yln0.ubl0425mz3s.0ac.webm?id=1154074[/video]
高登update左有得up片#good#

咩嚟?@_@


樓主部腦咩配置?


[video]https://upload.hkgolden.media/comment/d2bfaj1g.cdi5ky1yln0.ubl0425mz3s.0ac.webm?id=1154074[/video]
高登update左有得up片#good#

咩嚟?@_@

80年代Anal Lo


樓主部腦咩配置?

4090


之前用WAN SVI都係玩2D,所以冇留意
轉gen 3D CG,發現用左SVI後畫質會劣左(texture detail劣左好多)
可能係lightspeed model先會
但轉用非lightspeed model + lightspeed lora都係咁
就算加到8step都係同4step一好樣
冇理由唔行lightspeed而行20 step+,咁樣慢到接受唔到,所以冇試[sosad]
3D CG黎講LTX畫汁明顯靚過WAN SVI
唔用SVI就大家差唔多,但用舊方法駁片5秒後就會劣:~(


繼續試LTX 2.3
發現First Pass sampler較euler
好似解決到慢動作問題
要再試多的睇睇
原本個euler_ancestral_cfg_pp我睇落就有delay
例如prompt寫晒幾秒幾秒做的咩,10秒內容用euler_ancestral_cfg_pp可能做到5秒就完左[sosad]

試圖
https://upload.hkgolden.media/comment/4crj0d0n.o12pmdizgi1.natrscgx42p.5z0.jpg
之前用euler_ancestral_cfg_pp整左比較好既片
[video]https://upload.hkgolden.media/comment/wnjrpdv4.ezlarksbmsw.b4mlhxvxvtu.kfj.webm?id=1154318[/video]
呢個用euler整,prompt唔同,用相同prompt+euler_ancestral_cfg_pp整果條太跳脫cancel左[sosad]
[video]https://upload.hkgolden.media/comment/ai02gsvs.1jj2dh5j2us.rtq2iskgez1.d05.webm?id=1154324[/video]

呢條NSFW用相同seed+prompt整,個速度分別一目了然
euler_ancestral_cfg_pp
[video]https://upload.hkgolden.media/comment/jtamw5cp.sqrjvv4umxv.iz2px4zdrvt.2oh.webm?id=1154325[/video]
euler
[video]https://upload.hkgolden.media/comment/zoma0r3o.yaobmlmzx4j.hbhosww3d5f.nmp.webm?id=1154326[/video]


This one
https://upload.hkgolden.media/comment/s0nn22te.gl2mv22chcm.j3edjlnsgxq.p5t.png


喂啊[shocking]


LTX2.3建議用RuneXX個workflow
佢呢個workflow跟prompt跟得好好多 (雖然都係做唔到我想做既野[sosad] )
我用Basic同冇用佢個Prompt Enhancer
我睇返最主要分別應該係
text encoder用左
gemma_3_12B_it_fpmixed
同加左LTX2 NAG

之前既wf如果淨改用gemma_3_12B_it_fpmixed都一樣可以跟prompt好的
再加埋LTX2 NAG可能效果就一樣了(唔試了)
我用RuneXX果個加返1st pass video preview算
夠簡潔
除左個Prompt Enhancer冇多餘野#good#


長D ok???


長D ok???

邊條長D?


有新方法
用WAN2.2先gen一條低res岩樣岩動作既片 (低res gen快超過1倍)
然後將條片用LTX2.3做upscale (Final Pass)
岩岩試,暫時畫汁ok
要計下數究竟對比直接用WAN2.2 gen Hires係慢左定快左
如果相對快好多,應該可以轉用呢個方法[sosad]


試圖
https://upload.hkgolden.media/comment/0qt0wbie.o0mqywtlxic.kdbfp1m0pqk.sep.jpg
WAN 2.2 SVI 512x768 10s 16fps gen time ~9X秒
[video]https://upload.hkgolden.media/comment/l4orz3tx.wej54v2pihz.bdgreijw4cz.ivl.webm?id=1156334[/video]
Upscaled with LTX 2.3 (Final Pass) 1024x1536 10s 16fps (3 steps) gen time ~5X-8X秒 唔改prompt / ~9X-11X秒 有改prompt的話
[video]https://upload.hkgolden.media/comment/k2fagvl5.qir245woy1g.5lttx1e1p0k.adq.webm?id=1156335[/video]
WAN 2.2 SVI 960x1440 10s 16fps gen time ~41X秒 (我平時gen開的size)
[video]https://upload.hkgolden.media/comment/ec3d3jzu.vgwpuow0lvc.jc5lgghjfeg.1dp.webm?id=1156339[/video]

好處
1. WAN 2.2 Lowres生成速度快,可以當成係preview,結果好既先掉去LTX 2.3 upscale
2. 寫Prompt難度降低,WAN 2.2只需要簡單指示,就可以做到合理正常既動作,而且NSFW支援度高,現成loras豐富
3. 有聲!
4. 整體gen快左成倍

壞處
1. 可能出現唔應該出現既details (呢樣就算native LTX 2.3都有機會有,係佢upscale生details問題)
2. 原片如果gen得太勁(例如眼),upscale會有較嚴重既問題
3. 手指比native WAN2.2/LTX 2.3都差左
4. resolution雖然係仲高左,但畫汁係比native WAN2.2 SVI差


因為今次試圖係直圖show 3/4身,所以較容易有隻眼pixel太少導致變朦問題
我平時都係gen橫圖show半身多,眼佔既pixel會多好多
所以眼朦問題應該冇今次試圖咁明顯
之後先再試
例如睇下lowres如果再gen大小小又會唔會好的咁
同埋好似有少少郁得快就會變朦:~(


[shocking]
加ltx-2-19b-ic-lora-detailer lora可以提升返畫質#good# (呢個lora冇/未有2.3版)
唔計本身lowres gen得差朦到救唔倒,畫汁係好過WAN SVI:P
[video]https://upload.hkgolden.media/comment/esgkuefz.30sz2l5b2tl.vr5b0vyuum0.s0t.webm?id=1156351[/video]


樓主用咩display card#adore#


咁搞法真係整一套av出來都得#oh#


樓主用咩display card#adore#

睇到了 4090#adore#


冇咩跟開
想問下依家即時換頭最勁係用邊個framework?


冇咩跟開
想問下依家即時換頭最勁係用邊個framework?

我都冇跟開
你真係要「即時」近期應該係Deep-Live-Cam
但換臉技術好似冇突破 (我見都係用果的model,低炒果的效果都係麻麻)
你唔係玩live cam建議你用其他,界面會友善的
例如
comfyui-reactor-node
VisoMaster (獨立運作)
FaceFusion (獨立運作)

呢的一般有nsfw protection,有需要自己搵點解啦

你唔需要即時,而係想要效果靚
建議你搵返5-6年果的deepfake (eg DeepFaceLab)
呢的換臉效果先係堅野#good#


再試WAN2.2 upscale with LTX 2.3
今次幾肯定係動作快(變化大)會炒,而唔係原圖pixel少會炒
同埋試左好多次LTX粒lin都係畫得唔好xx(
就算加左nude body用既lora都係咁
如果1st frame本身有lin俾佢參考就ok既

nsfw
WAN 2.2 768x512
[video]https://upload.hkgolden.media/comment/culy3tzv.hjtcg0xnbjc.up4shthbaiw.iuo.webm?id=1156977[/video]https://upload.hkgolden.media/comment/culy3tzv.hjtcg0xnbjc.up4shthbaiw.iuo.webm?id=1156977

upscale with LTX 2.3 1536x1024
[video]https://upload.hkgolden.media/comment/3iam1nck.j5l1jsmq4xv.s0fqcdb05fh.30b.webm?id=1156978[/video]https://upload.hkgolden.media/comment/3iam1nck.j5l1jsmq4xv.s0fqcdb05fh.30b.webm?id=1156978

高登有時會Load唔到片,貼埋link


雖然靜態畫汁同有聲真係正的,但動態效果真係麻麻
暫時都係等新版/其他方法算:~(


勁!#adore#dw


試緊Wan2GP
因為標榜低Ram用,所以之前冇用過
但見人話幾好用

暫時淨係試左WAN 2.2
佢個SVI 2 Pro畫汁緊正
用佢個Lightning i2v v2025-10-14 2 Phases - 4 Steps Preset
雖然相同resolution下比ComfyUI gen得慢
但畫汁最少贏一班(畫汁等同ComfyUI冇用SVI)
佢唯一問題係每5秒個畫面都會轉暗1次(畫汁冇變)
但唔見有人回報過呢個問題

研究係ComfyUI做返同一野,但發現佢個的model都係佢自己整,專for Wan2GP
SVI 2 Pro model係用int8
KJ話佢唔support int8:~(

至於Wan2GP既SVI 2 Pro Enhanced Lightning v2
畫汁就同ComfyUI用SVI一樣咁勁
而佢gen速都係同SVI 2 Pro + Lightning Preset咁慢

之後試Wan2GP既LTX


終於搵到WAN 2.2 upscale with LTX 2.3基本唔炒既方法
除左抖大氣果下郁得快的頭髮motion blur炒炒地之外,基本都冇炒#good# (就算Native LTX 2.3郁得快時效果其實都麻麻,尤其係手指)
但呢個真係純upscale,唔可以改變口型,直接加對白落去
只可以配合返個口型,所以我淨係叫佢加左的呼吸聲
同埋Step係8+3,遲下試下就咁3step效果點先[sosad]
對比用WAN 2.2 SVI直接gen大長片
好處係用LTX 2.3做upscale,可以根據ref frame(1st frame)對原圖細節進行修復
特別係每5秒之後SVI都會出現各種劣化 (用SVI專用model會好少少)
所以為左畫汁提升,係值得咁做 (overall其實都係gen快左[sosad] )

同之前同一段nsfw
[video]https://upload.hkgolden.media/comment/b5vz2v3r.vqbafk0xjab.425h2oxkfaz.hiv.webm?id=1161109[/video]
https://upload.hkgolden.media/comment/b5vz2v3r.vqbafk0xjab.425h2oxkfaz.hiv.webm?id=1161109
ps 最後手指有錯


發現WAN 2.2 upscale with LTX 2.3唔炒既秘密係在於fps
之前跟返原WAN 2.2 gen 16fps,所以會炒炒地
如果force rate set返原片做假24/25 fps (會用重複frame黎湊齊)
咁樣gen出黎就唔會炒
又可以改得返口型,同只係行3steps#good#


試Image to 3D
https://github.com/visualbruno/ComfyUI-Trellis2
https://www.reddit.com/r/StableDiffusion/comments/1svw8fm/trellis_2_workflow_update/

勁難裝,裝左N次先掂
基本上係焗你用Python 3.11 and Torch = 2.7.0 + cu128,唔好諗其他:o)
用reddit個wf,冇較過野,張圖都冇upscale,得623x900
大約run三百幾秒就出到 (再行另一個29x秒)
遠睇誇啦啦#yup#
https://upload.hkgolden.media/comment/erlim1v0.dd4lig5m20g.p50iw0xlxko.vdk.gif
近睇吹喇叭[sosad]
https://upload.hkgolden.media/comment/qmyy0j4m.b2zj20cuxjf.nybyspfaogv.a34.jpg

reddit果個wf係一take過有埋texture
用跟機個HQ texture wf,再整多次texture
除左對眼,其他位都好左#good#
https://upload.hkgolden.media/comment/y4nxxib1.ozsdbtr22rd.2hu1wgai2bq.1tl.gif
https://upload.hkgolden.media/comment/3cvuxdfu.zdysn3rzbtw.lj3q1o034sd.bsh.jpg

繼續跟機HQ texture wf,今次用upscaled圖+texture size較返4096同resolution 1536
對眼出返黎啦#good#
https://upload.hkgolden.media/comment/raphu4mf.vzdpbncee4b.xmjisiuat5q.3kn.jpg

用原裝HQ NoCascade wf+upscaled圖出黎個model面相其實唔差
不過texture精度都係好唔掂,唔貼了
https://upload.hkgolden.media/comment/cttm0q5r.ht4gufji5kc.yimv5kluvti.n5r.jpg

仲有support multiview (前後左右)

原圖
https://upload.hkgolden.media/comment/npdqcoij.pvj1uixbnkf.cltlhwlxxpu.lju.png

聽日先下Q版好似黏土人果的圖,效果應該會好的[sosad]


跳至第



  快速回覆 - 輸入以下項目

本討論區現只接受會員張貼文章,本站會員請先登入。非會員人仕,您可以按此加入為新會員,費用全免,並可享用其他會員服務。


上次光臨時間: 4/6/2026 18:28
今天貼文總數: 537 | 累積文章數目: 7,496,865

聯絡我們 |  服務條款 |  私隱政策
Copyright © 2026 HKGolden.com. All Rights Reserved.