𝔏ℑ𝔑'𝔖 𝔅𝔏𝔒𝔊
small talk
2020-08-28
1 / 2
machine-learning
2019 nCov Data Simple Analysis
Hermit
/
2020-02-21
今年2020剛開始便被這個來自2019年傳出的2019n-Cov(俗稱的武漢肺炎病毒)鬧的人心惶惶,而在我們偉大的中國共產黨領導下,疫情也是如雨後春筍般的在中國甚至鄰近國家散播,而前陣子有個同學在偉大中國共產黨疫情通報網(link: http://www.nhc.gov.cn/xcs/yqtb/list_gzbd.shtml) 上,將疫情人數的數量做成表,並用excel繪製了一個簡單的圖表以及用Benford’s law檢查了資料是否有造假的可能,但因疫情假期還很長,因此變跟他要了這個(基本上是造假的)data,想說跑一些簡單的資料探勘看看會不會有有趣的結果。 […]…
SQL
SQL Query Optimization
Hermit
/
2020-01-06
這學期修的資管系資料庫系統期末報告,主要是建立一個有著大資料表的資料庫系統,並且針對系統下三個查詢語句,並且進行查詢句的優化,老師有說可使用oracle或是Mongodb來完成這個project,但期中project時我們已經建立一個oracle資料庫系統,裡面的資料有六個table,其ERD如下: 主要是一個台灣股價網頁查詢回測系統,(該網站連結:http://140.117.70.87:3838/dbproject/, 可使用訪客帳號test1,密碼test1),這邊稍微介紹一下這次專案會用到的資料型態,我們主要使用兩個table,stock_price_data以…
machine-learning
Paper Review [LOTUS:Logistic Tree with Unbiased Selection]
Hermit
/
2019-12-26
因為修統計書報的關係,這次也被分配要報告一個章節,雖然那本書是工具書取向,但是發現該作者有在2004年寫了一篇有關logistic regression的演算法,他稱之為LOTUS,主要是希望可以解決當時logistic regression的一些問題。 Logistic Regression主要優勢是在他算法快、存處資源低;缺點是如果模型存在共線性、非線性、或交互作用存在,則模型並不好解釋。 為了克服以上問題,作者提出了一種模型:LOTUS(Logistic Regression with Unbiasd Selection) 通過樹狀分割數據並且fit不同的Logistic…
deep-learning
Paper Review [OCGAN: One-class Novelty Detection Using GANs with Constrained Latent Representations]
Hermit
/
2019-12-23
這禮拜看完一篇有關生成對抗網路與One Class Learning 結合的論文(Source Link:https://arxiv.org/abs/1903.08550) ,其名稱為<>,因此主要方法與我目前在用的內容有關。 作者提出了一種稱為OCGAN的檢測模型,其目的是確定是否樣本來自同一個種類。作者的方案是基於使用auto-encoder network來學習神經網路單類樣本的潛在表示。而本篇文章的模型可明確限制潛在空間。為了實現這一目標,首先迫使潛在空間通過以tanh的激活函數引入編碼器的輸出。其次,利用adversariallyr鑑別潛在空間,確保同類的編碼表示類似於從…
deep-learning
GAN Based Small Sample Augmentation
Hermit
/
2019-11-25
I read some paper about GAN for generate synthetic sample data. Then I find a paper it’s framework works similar with my one-class-GAN. So I want to record the paper’s marrows this time. There is the paper resource link:…
deep-learning
GAN with One Class Learning
Hermit
/
2019-11-09
先前幾次我嘗試使用生成對抗網路產生一系列資料,但我們知道GAN的訓練很難調整,除非將生成資料直接拿去訓練比照結果,否則很難知道這次生成樣本的品質(這裡的品質是指有時候樣本過少時,我們產生所需的假資料是否能完美的當作一般樣本進行後續分析),因此我想透過一些外部機制來當作衡量生成器生成的品質驗證,後來思考其實這有點像是異常檢測,若是先將真實資料做一個一元的異常檢測分類器,我們便可將GAN產生的資料用此當作二次確認(第一次確認是在GAN當中的判別器),構想圖如下: 我們將想要生成的某類資料匯入後,先建構一個一元分類器,並將所有資料點都包含於正常資料。接著將原資料匯入GAN當中,經過幾次迭代後,我們…
««
«
1
2
»
»»