360doc--wenasunny的文章
http://www.ahfyzs.com/rssperson/20320906.aspx
360doc (http://www.ahfyzs.com)
zh-cn
360doc--個(gè)人圖書館
-
LogisticRegression
http://www.ahfyzs.com/content/19/0429/16/20320906_832327653.shtml
2019/4/29 16:55:56
某種類型樣本量越多,則權(quán)重越低,樣本量越少,則權(quán)重越高。具體做法是,對(duì)于第K類的分類決策,我們把所有第K類的樣本作為正例,除了第K類樣本以外的所有樣本都作為負(fù)例,然后在上面做二元邏輯回歸,得到第K類的分類模型。如果模型有T類,我們每次在所有的T類樣本里面選擇兩類樣本出來,不妨記為T1類和T2類,把所有的輸出為T1和T2的樣本放在一起,把T1作為正例,T2作為負(fù)例,進(jìn)行二元邏輯回歸,得到模型參數(shù)。
-
6個(gè)方面分析:知識(shí)圖譜的價(jià)值和應(yīng)用 | 人人都是產(chǎn)品經(jīng)理
http://www.ahfyzs.com/content/19/0425/16/20320906_831406569.shtml
2019/4/25 16:32:09
如果知識(shí)圖譜的數(shù)據(jù)源來自不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)源,在系統(tǒng)已經(jīng)從不同的數(shù)據(jù)源把不同結(jié)構(gòu)的數(shù)據(jù)提取知識(shí)之后,接下來要做的是把它們?nèi)诤铣梢粋€(gè)統(tǒng)一的知識(shí)圖譜,這時(shí)候需要用到知識(shí)融合的技術(shù)(如果知識(shí)圖譜的數(shù)據(jù)結(jié)構(gòu)均為結(jié)構(gòu)化數(shù)據(jù),或某種單一模式的數(shù)據(jù)結(jié)構(gòu),則無需用到知識(shí)融合技術(shù))。利用知識(shí)圖譜融合以上企業(yè)數(shù)據(jù),可以構(gòu)建企業(yè)知識(shí)圖譜,并在企業(yè)知識(shí)圖譜之上利用圖譜的特性,針對(duì)金融業(yè)務(wù)場(chǎng)景有一系列的圖譜應(yīng)用,舉例如下:
-
中國保險(xiǎn)行業(yè)協(xié)會(huì) 行業(yè)要聞 知識(shí)圖譜技術(shù)在保險(xiǎn)業(yè)的應(yīng)用實(shí)踐及前景展望
http://www.ahfyzs.com/content/19/0425/09/20320906_831308569.shtml
2019/4/25 9:30:31
中國保險(xiǎn)行業(yè)協(xié)會(huì) 行業(yè)要聞 知識(shí)圖譜技術(shù)在保險(xiǎn)業(yè)的應(yīng)用實(shí)踐及前景展望。要將人工智能技術(shù)(包括深度學(xué)習(xí)、人臉識(shí)別、知識(shí)圖譜等技術(shù))列入保險(xiǎn)業(yè)發(fā)展戰(zhàn)略,追求人工智能與保險(xiǎn)業(yè)的深度融合,開展基礎(chǔ)理論、重點(diǎn)領(lǐng)域、交融模式和關(guān)鍵技術(shù)系統(tǒng)研究,推動(dòng)知識(shí)圖譜等人工智能技術(shù)成為行業(yè)轉(zhuǎn)型升級(jí)和提升保險(xiǎn)服務(wù)實(shí)體經(jīng)濟(jì)能力的強(qiáng)有力支撐。目前,知識(shí)圖譜技術(shù)在各家保險(xiǎn)公司的運(yùn)用主要是基于內(nèi)部交易數(shù)據(jù),但這些數(shù)據(jù)資源相當(dāng)有限。
-
知識(shí)圖譜在推薦系統(tǒng)的落地 | 人人都是產(chǎn)品經(jīng)理
http://www.ahfyzs.com/content/19/0425/09/20320906_831307199.shtml
2019/4/25 9:24:29
本篇文章為大家介紹了什么是推薦系統(tǒng)、推薦系統(tǒng)運(yùn)作流程、圖譜應(yīng)用的優(yōu)勢(shì)、圖譜在推薦中的應(yīng)用、圖譜推薦的原理、圖譜推薦的難點(diǎn),并附上實(shí)際例子幫助大家進(jìn)一步了解。本文通俗的講述通過幾個(gè)段落簡(jiǎn)單講述什么是推薦系統(tǒng)、推薦系統(tǒng)運(yùn)作流程、圖譜應(yīng)用的優(yōu)勢(shì)、圖譜推薦的原理、圖譜推薦的難點(diǎn),供大家參考了解。在推薦系統(tǒng)中應(yīng)用的圖譜都是大規(guī)模的圖譜,實(shí)體都是在萬級(jí)的,像阿里的商品圖譜甚至達(dá)到了十億級(jí)。
-
python 散點(diǎn)圖
http://www.ahfyzs.com/content/18/0809/14/20320906_776872788.shtml
2018/8/9 14:52:24
python 散點(diǎn)圖。最近開始學(xué)習(xí)python編程,遇到scatter函數(shù),感覺里面的參數(shù)不知道什么意思于是查資料,最后總結(jié)如下:1、scatter函數(shù)原型。2、其中散點(diǎn)的形狀參數(shù)marker如下:5、當(dāng)scatter后面參數(shù)中數(shù)組的使用方法,如s,當(dāng)s是同x大小的數(shù)組,表示x中的每個(gè)點(diǎn)對(duì)應(yīng)s中一個(gè)大小,其他如c,等用法一樣,如下:注: 這就是scatter基本的用法。
-
SAS 分析常用的過程 過程步大全
http://www.ahfyzs.com/content/17/1231/10/20320906_717854633.shtml
2017/12/31 10:39:39
PROC FACTOR.PROC FASTclus data=Arndata.clusdat maxclusters=3 list out=clusdat_Out;PROC VARclus data=Arndata.clusdat;PROC VARclus centroid data=Arndata.clusdat outtree=clusdat_out;PROC DISCRIM data=Arndata.discrimdat list out=discrimdat_Out distance pool=yes;PROC DISCRIM data=Arndata.discrimdat1 testdata=Arndata.discrimdat2 testlist testout=discrimdat_Out;
-
SQL左右連接中的on and和on where的區(qū)別
http://www.ahfyzs.com/content/17/0428/09/20320906_649285471.shtml
2017/4/28 9:36:22
SQL左右連接中的on and和on where的區(qū)別。ID TYPE ID CLASS ---------- ---------- ---------- ---------- 1 2 1 1 對(duì)比發(fā)現(xiàn):(⑤,⑥)和(⑦,⑧)結(jié)果都一樣,也就是說內(nèi)連接inner join on and 或者on where不管是對(duì)左表還是右表進(jìn)行過濾,實(shí)際都是在生成臨時(shí)表以后再進(jìn)行過濾的,而且對(duì)左表和右表都起作用,這與左連接left join有本質(zhì)的區(qū)別!?。?/blockquote>
-
ROC和AUC介紹以及如何計(jì)算AUC
http://www.ahfyzs.com/content/17/0306/10/20320906_634368020.shtml
2017/3/6 10:36:52
這篇博文簡(jiǎn)單介紹ROC和AUC的特點(diǎn),以及更為深入地,討論如何作出ROC曲線圖以及計(jì)算AUC。這條對(duì)角線上的點(diǎn)其實(shí)表示的是一個(gè)采用隨機(jī)猜測(cè)策略的分類器的結(jié)果,例如(0.5,0.5),表示該分類器隨機(jī)對(duì)于一半的樣本猜測(cè)其為正樣本,另外一半的樣本為負(fù)樣本。下圖是一個(gè)示例,圖中共有20個(gè)測(cè)試樣本,“Class”一欄表示每個(gè)測(cè)試樣本真正的標(biāo)簽(p表示正樣本,n表示負(fù)樣本),“Score”表示每個(gè)測(cè)試樣本屬于正樣本的概率[^4]。
-
孫過庭《書譜》(高清圖 附釋文)
http://www.ahfyzs.com/content/12/0107/18/232916_177928176.shtml
2017/2/24 14:44:22
孫過庭《書譜》(高清圖附釋文)
-
孫過庭《書譜》原文、注釋和譯文
http://www.ahfyzs.com/content/17/0224/14/20320906_631675042.shtml
2017/2/24 14:43:48
孫過庭《書譜》原文、注釋和譯文 孫過庭《書譜》原文、注釋和譯文摘要: 孫過庭《書譜》原文、注釋和譯文 孫過庭簡(jiǎn)介和解題: 孫過庭(約六四六年——六九一年),唐垂拱年間書法家、書法理論家。一說名虔禮,字過庭。孫過庭(約六四六年——六九一年),唐?垂拱年間書法家、書法理論家。近人朱建新在所著孫過庭《書譜箋證》一書中認(rèn)為,《書譜》應(yīng)是全文,唯屢經(jīng)裝裱,中間已有斷失,“卷下”等字失去,故多雜議。
-
《書譜》原文及譯文
http://www.ahfyzs.com/content/11/0915/12/2006953_148416614.shtml
2017/2/15 17:59:31
今譯:關(guān)于古代以來,善長書法的人,在漢、魏時(shí)期,有鐘繇和張芝的卓絕書藝,在晉代末期是王羲之和王獻(xiàn)之的墨品精妙。今譯:我少年讀書時(shí),就留心學(xué)書法,體會(huì)鐘繇和張芝的作品神采,仿效羲之與獻(xiàn)之的書寫規(guī)范,又竭力思考專工精深的訣竅,轉(zhuǎn)瞬過去二十多年,雖然缺乏入木三分的功力,但從未間斷臨池學(xué)書的志向。今譯:在以往書法家中,王羲之的書跡為各代人所贊譽(yù)學(xué)習(xí),可作為效法的宗師,從中獲得造就書法的方向。
-
決策樹V1
http://www.ahfyzs.com/content/17/0119/11/20320906_623448864.shtml
2017/1/19 11:04:34
宏2:vlev 對(duì)變量的所有水平遍歷 /*遍歷變量的水平*/ %macro vlev(set,var,iter,vlib=tree_tmp); /*遍歷當(dāng)前變量的所有水平*/ proc sql noprint; select count(*) into :_lev_tem from &vlib..&set._lev where var_cand="&var" ;/*純子集的熵增為0*/%if &ent_gap >0.001 %then %do;data tem2;set tree.stack(where=(set_from="&set" and var_name="&win_var"));iter=iter+1;keep set_from set_name iter set_recs set_ent;run;
-
Python·Jupyter Notebook各種使用方法記錄·持續(xù)更新
http://www.ahfyzs.com/content/17/0115/23/20320906_622722374.shtml
2017/1/15 23:29:42
Python·Jupyter Notebook各種使用方法記錄·持續(xù)更新Python·Jupyter Notebook各種使用方法記錄·持續(xù)更新。1 Jupyter的工作空間在哪里指定2 如何找到該配置文件三Jupyter的各種快捷鍵四Jupyter Notebook如何導(dǎo)入代碼。1 將本地的py文件load到j(luò)upyter的一個(gè)cell中2 從網(wǎng)絡(luò)load代碼到j(luò)upyter五Jupyter運(yùn)行python文件六Jupyter一些其他瑣碎用法。一、 Jupyter NoteBook的安裝1.1 新版本Anaconda自帶Jupyter.
-
Notepad++配置Python開發(fā)環(huán)境
http://www.ahfyzs.com/content/17/0113/16/20320906_622237486.shtml
2017/1/13 16:33:16
該命令行的含義是:首先cd 到該要執(zhí)行的Python腳本所在的目錄(CURRENT_DIRECTORY),在該目錄下,執(zhí)行 python程序,這樣工作目錄就由默認(rèn)的Notepad++的安裝目錄,改為了該要執(zhí)行的Python腳本所在的目錄?!?】如何在Notepad++中配置Python開發(fā)環(huán)境(http://glorywu.com/如何在Notepad++中配置Python開發(fā)環(huán)境/)【2】Notepad++搭建Python開發(fā)環(huán)境的一個(gè)小改進(jìn)(http://www.cnblogs.com/tt-0411/archive/2011/10/30/2229544.html)
-
機(jī)器學(xué)習(xí)
http://www.ahfyzs.com/content/17/0109/13/20320906_621277724.shtml
2017/1/9 13:32:37
其實(shí)Boosting更像是一種思想,Gradient Boosting是一種Boosting的方法,它主要的思想是,每一次建立模型是在之前建立模型損失函數(shù)的梯度下降方向。這句話有一點(diǎn)拗口,損失函數(shù)(loss function)描述的是模型的不靠譜程度,損失函數(shù)越大,則說明模型越容易出錯(cuò)(其實(shí)這里有一個(gè)方差、偏差均衡的問題,但是這里就假設(shè)損失函數(shù)越大,模型越容易出錯(cuò))。我們的模型是由多個(gè)模型加起來的,β表示每個(gè)模型的權(quán)重,α表示模型里面的參數(shù)。
-
【機(jī)器學(xué)習(xí)基礎(chǔ)】梯度提升決策樹
http://www.ahfyzs.com/content/17/0109/13/20320906_621276518.shtml
2017/1/9 13:26:44
2.2 AdaBoost誤差函數(shù)。上面解釋到了,AdaBoost在迭代學(xué)習(xí)的過程,就是希望讓∑un(t)越來越小的過程,那么我們新的目標(biāo)就是最佳化∑un(T+1): 我們可以畫出0/1錯(cuò)誤和AdaBoost誤差函數(shù)err(s,y) = exp(-ys)的函數(shù)曲線,我們發(fā)現(xiàn)AdaBoost的誤差函數(shù)(稱為exponential error measure)實(shí)際上也是0/1錯(cuò)誤函數(shù)的上限函數(shù),于是,我們可以通過最小化該函數(shù)來起到最佳化的效果。梯度提升應(yīng)用于回歸問題時(shí),誤差函數(shù)選中均方誤差函數(shù)。
-
解決各種python庫無法安裝的問題,直接安裝編譯文件
http://www.ahfyzs.com/content/16/1231/15/20320906_619106737.shtml
2016/12/31 15:19:48
解決各種python庫無法安裝的問題,直接安裝編譯文件例如 lxml的處理方式:Python3.4 用 pip 安裝lxml時(shí)出現(xiàn) “Unable to find vcvarsall.bat ”?
-
GBDT代碼解讀
http://www.ahfyzs.com/content/16/1230/10/20320906_618843025.shtml
2016/12/30 10:53:13
-
[轉(zhuǎn)載]logistic回歸模型總結(jié)
http://www.ahfyzs.com/content/16/1229/10/20320906_618603040.shtml
2016/12/29 10:35:17
[轉(zhuǎn)載]logistic回歸模型總結(jié)。二、logistic回歸模型初步。而logistic是一個(gè)分類模型,目標(biāo)變量只是一個(gè)分類標(biāo)識(shí),因此更關(guān)注預(yù)測(cè)值和預(yù)測(cè)值之間的相對(duì)一致性而不是絕對(duì)一致性。Probability modeled is remiss=1.(注:這個(gè)要關(guān)注指明了模型求的是在自變量作用下因變量remiss=1的概率)(二)Stepwise SelectionProcedure(注:逐步回歸的選擇過程,說明了模型是怎么一步步根據(jù)一定的原則來選擇最終進(jìn)入模型的變量的)
-
SAS多元分析之聚類(1)–proc cluster | Statistics with SAS
http://www.ahfyzs.com/content/16/1228/13/20320906_618392632.shtml
2016/12/28 13:19:33
SAS多元分析之聚類(1)–proc cluster | Statistics with SAS。本文主要對(duì)SAS做聚類分析的proc cluster步的應(yīng)用做一個(gè)簡(jiǎn)單的摘錄,相關(guān)的理論知識(shí)細(xì)節(jié),請(qǐng)參見SAS help文檔及其他統(tǒng)計(jì)學(xué)相關(guān)文獻(xiàn)等。proc cluster一般適用于規(guī)模較小的樣本觀測(cè)聚類(即Q型聚類)。outtree= 生產(chǎn)一個(gè)數(shù)據(jù)集,存儲(chǔ)cluster過程的聚類歷史,可被proc tree調(diào)用作圖。用proc cluster做聚類分析,采用Ward法,如下:?View Code SAS。proc sort data=result;