Jump to...
redirecting...

Log for YSITD

這什麼鬼www
54.5 EFLOPS
嚇哭
Minecarft@Home 笑死
Microsoft@Home
問,如果我現在有個 imbalance dataset 要做 oversampling,同時需要做 data preprocessing (例如原本只有一個日期,我要額外加上一個 column 判斷他是不是週末)
我應該先做 preprocessing 還是先做 oversampling

如果先做 preprocessing,我擔心會出現一個日期在 oversampling 之後被移動到非週末,可是週末的 attribute 仍然為 true
如果先做 oversampling,假設是不是在週末是個很重要的 feature,則好像又會出現被移動到週末但 label 仍然為真,於是就創造了誤導性的 data
求 ML 大師拯救
到現在他們還不給你門禁帳號ㄛ
截圖笑死
笑死,都迷因
先 pre
可是你拿 One-hot encoding 去做 oversampling 沒道理吧?
就算是 SMOTE-NC 也沒道理阿
更正一下 先 oversmaple 再 process
剛剛審題不清
喔喔,豪,謝謝
不過還是求詳細
至於你說那個誤導性的 data 不存在ㄅ
那個是你 process 後創建出來的 feature
他沒有誤導 他就是你想要的結果啊
至於這個 feature 有沒有用 你 cross vaild 就會知道了
喔喔,豪 @@
謝謝
&& SMOTE 本來就會讓特徵失真
[sticker](media:AAMCBQADHQI9ls-AAAEVLc9fGQ2U7yRL7AXOOPOl3_0F10wYYQAC_wcAAhIzkhBzcD8Jq-D7g6TB-TIABAEAB20AAzIjAAIaBA@telegram)
好ㄅ,謝謝~
如果你
我是覺得兩個都可以試試看
就 如果 label 錯了 你可以把它當雜訊增加模型的抗噪能力
好 XD 謝謝
你各位在沒網路的時代能不能用網路自學程式啊
可以啊
[sticker](media:AAMCBQADHQI9ls-AAAEVLdtfGa87X7TFwU7-qj87jOp5MUPmoAACBQADkyvZHYar0hcZH9sbHOLUMgAEAQAHbQADhSsAAhoE@telegram)
窩也想體驗有 newsgroup 可以看的年代
只有我覺得去說這個很無聊ㄇ
看起來就是一個很白痴的筆誤而已
ㄛ我沒看到後續說明
但是就
很有趣ㄚ(?)
他之後改成 在網路還不普及的年代
我的意思是我剛剛沒看到((