𝔏ℑ𝔑'𝔖 𝔅𝔏𝔒𝔊
Lin's Blog
2020-08-28
4 / 8
R
The R Function Definition for CRE Bacteria Data Analysis
Hermit
/
2019-12-10
這次是跟上次使用相同的資料,只是變成要定義一個規定格式的function,剛好上次的code裡面logistic regression的分類器有寫錯的部分,因此可以順便趁這次的機會修改之前錯誤的地方,部分內容可參考以前那篇blog(CRE Bacteria Data Analysis: https://hermitlin.netlify.com/post/2019/04/24/cre-bacteria-data-analysis/) 一樣我會將資料先進行倒轉,並且為前46個樣本上cre的標籤,後49則上非cre的標籤。 主要差異為,這次要進行pca,因此再倒轉資料時,並未挑選重要的前50個變…
R
Using Rvest Crawler On Simple Chiness Web
Hermit
/
2019-12-04
在之前的文章裡(link:https://hermitlin.netlify.com/post/2019/05/23/web-crawler-on-simple-chinese-web/) ,我只抓取了該本書的八個章節,而最近我需要將其改為能對於該網站(link: https://heavenlyfood.cn/books/menu.php?id=2021) 的各本書進行相同的爬取,並且須以該書名建立資料夾,儲存該本書各章節的內容。同樣的,我使用了rvest與ropencc這兩個package幫我完成爬蟲以及簡轉繁的工作。 […] if…
Python
The Crawler Code in my internship.
Hermit
/
2019-11-28
In this summer vacation, I was become a intern engineer in a internet service company. In fact, our company is an eshops price comparison platform. Here is the website link:https://biggo.com.tw/ . They crawler the products information in different eshops like Amazon, PChome etc. Build a SQL system…
deep-learning
GAN Based Small Sample Augmentation
Hermit
/
2019-11-25
I read some paper about GAN for generate synthetic sample data. Then I find a paper it’s framework works similar with my one-class-GAN. So I want to record the paper’s marrows this time. There is the paper resource link:…
deep-learning
GAN Sampling Versus Other Sampling Method On Credit Card Fraud Detection Data
Hermit
/
2019-11-19
這次,我將使用一個來自kaggle的不平衡數據資料(link:https://www.kaggle.com/mlg-ulb/creditcardfraud/version/1). 該數據集包含了歐洲持卡人2013年9月通過信用卡進行的交易。這些交易發生在兩天之內,在這裡我們有492筆詐騙資料以及284807正常交易資料。該數據集是非常不平衡的,其中陰性樣本(詐欺)佔所有交易的0.172%。它的變量包含數值輸入變量後PCA變換的結果。不幸的是,由於保密問題我們不能得到原始數據的更多背景信息。特徵V1,V2,…… V28與PCA獲得的主成分,還沒有被轉化與PCA的變量是“交易時間”和“交易金額”。…
deep-learning
Practice in GAN with One Class Learning
Hermit
/
2019-11-14
這次我將使用先前東海大學大數據競賽的初賽資料,也就是熱成化加工的數據資料,而該資料中一共有8類,我將資料的第5與8類挑選出來,並僅取3筆第5類資料與136筆第8類資料作為訓練資料,而驗證資料則為9筆第5類資料與136筆第8類資料作為測試資料,因此我們的目標是使用生成對抗網路來生成第5類資料以達到資料平衡後進行後續的分類分析。 […] import pandas as pd import numpy as np df = pd.read_csv('C:/Users/User/OneDrive -…
««
«
1
2
3
4
5
…
8
»
»»