| UDF資源文件 UDF測(cè)試程序 這里解釋什么是用戶定義函數(shù)(UDF),是做什么的和怎樣使用 1)用戶定義函數(shù)(UDF)是什么? 基本用戶定義函數(shù)是一類代碼,對(duì)MYSQL服務(wù)器功能進(jìn)行擴(kuò)充,通過添加新函數(shù),性質(zhì)就象使用本地MYSQL函數(shù)abs()或concat().UDF是用C(或C++)寫的。也許還可以用BASIC,.NET或其它什么雖然我還沒見過有人這么做。 2)為什么和怎樣使用UDF功能? 從字面上何以知道UDF是很有用的,尤其當(dāng)你需要擴(kuò)展MYSQL服務(wù)器功能時(shí)。下表給出了最佳解決方法的比較: Method Speed Language Development 方法 速度 語言 開發(fā) Stored Procedures slow SQL ~minutes (for small functions) 存儲(chǔ)過程 慢 SQL ~分鐘(對(duì)于小函數(shù)) UDF fast C ~hour UDF 快 C ~小時(shí) Native Function fast C major pain in the *** 本地函數(shù) 快 C 未知 慢的意思是和其它比較時(shí)。存儲(chǔ)過程和一般SQL語句比仍然是很快的。 對(duì)本地函數(shù)的一點(diǎn)解釋:本質(zhì)上和UDF沒太大區(qū)別。但是你必須用MYSQL的資源代碼來寫然后重新編譯全部。這將是很大的工作量,你必須一邊又一邊的用最新版的MYSQL來完成這項(xiàng)工作。 3)怎樣使用UDF? 這部分很簡(jiǎn)單。當(dāng)你完成了一個(gè)UDF,你只是使用它就可以了。例如:"SELECT MyFunction(data1, data2) FROM table" 4)編寫UDF 現(xiàn)在我們開發(fā)寫一個(gè)UDF: 建立一個(gè)新的shared-library項(xiàng)目(該例中我用的VC++ 6.0建立一個(gè)標(biāo)準(zhǔn)的DLL) 首先我需要一些頭文件。這些頭文件是標(biāo)準(zhǔn)的頭文件和MYSQL服務(wù)器的包含目錄里的文件 #ifdef STANDARD /* STANDARD is defined, don't use any mysql functions */ #include <stdlib.h> #include <stdio.h> #include <string.h> #ifdef __WIN__ typedef unsigned __int64 ulonglong; /* Microsofts 64 bit types */ typedef __int64 longlong; #else typedef unsigned long long ulonglong; typedef long long longlong; #endif /*__WIN__*/ #else #include <my_global.h> #include <my_sys.h> #endif #include <mysql.h> #include <ctype.h> static pthread_mutex_t LOCK_hostname; 現(xiàn)在我必須決定我們需要哪類函數(shù)。本質(zhì)上有兩種選擇: 該函數(shù)是聚合函數(shù)嗎?(后面我們將學(xué)習(xí)很多關(guān)于聚合函數(shù)的內(nèi)容) 返回類型是什么?有4個(gè)選擇: 類型 描述 STRING 一個(gè)合法的字符串,轉(zhuǎn)換成char*類型 INTEGER 一個(gè)普通的整型變量,轉(zhuǎn)換成64位的整型 REAL型 一個(gè)俘點(diǎn)數(shù),轉(zhuǎn)換成double型 DECIAML型 這個(gè)并沒真正的結(jié)束,MYSQL將做字符串對(duì)待 現(xiàn)在開始討論關(guān)于非聚合函數(shù)。必須聲明并執(zhí)行一些MYSQL使用UDF時(shí)用到的函數(shù),但首先一些必要的結(jié)構(gòu)必須并確: UDF_INIT: 類型 名稱 描述 <code> my_bool maybe_null 是1如果函數(shù)能返回NULL unsigned int decimals 針對(duì)REAL函數(shù) unsigned long max_length 針對(duì)字符串函數(shù) char * ptr 自由指針針對(duì)函數(shù)的數(shù)據(jù) my_bool const_item 0如果結(jié)果是獨(dú)立的 UDF_ARGS: 類型 名稱 描述 unsigned int arg_count 成員數(shù)量 enum Item_result * arg_type 成員類型的數(shù)組 char ** args 指向成員的指針的數(shù)組 unsigned long * lengths 成員長度的數(shù)組(針對(duì)字符串) char * maybe_null "maybe_null"標(biāo)記的數(shù)組 char ** attributes 指向成員屬性的指針的數(shù)組 unsigned long * attribute_lengths 屬性長度數(shù)組 現(xiàn)在看一下該函數(shù): De-/Initialization: Collapseextern "C" my_bool MyTest_init(UDF_INIT *initid, UDF_ARGS *args, char *message) { //非常重要的一件事是建立內(nèi)存 //你需要 //我們需要一個(gè)很長的變量來保存檢測(cè)數(shù) //雖然該例中我們不需要 longlong* i = new longlong; // 建立變量 *i = 0; // 設(shè)初值 //指針變量中保存為一個(gè)字符指針 //確認(rèn)你不會(huì)遇到類型問題 initid->ptr = (char*)i; //檢測(cè)成員的格式 if (args->arg_count != 1) { strcpy(message,"MyTest() requires one arguments"); return 1; } if (args->arg_type[0] != INT_RESULT) { strcpy(message,"MyTest() requires an integer"); return 1; } return 0; } extern "C" void MyTest_deinit(UDF_INIT *initid) { //這里必須清空所分配的內(nèi)存 //引入函數(shù) delete (longlong*)initid->ptr; } The actual function: extern "C" longlong MyTest(UDF_INIT *initid, UDF_ARGS *args, char *is_null, char *error) { /*最后這是我們實(shí)際的工作部分。該函數(shù)為每個(gè)記錄調(diào)用,返回值或指向當(dāng)前值的指針保存在UDF_ARGS變量中。我們必須獲得值,完成計(jì)算并返回值。注意你可以通過UDF_INIT變量進(jìn)入MyTest_init中分配的內(nèi)存,該例中我們將為每個(gè)值設(shè)置為5 */ return *((longlong*)args->args[0])+5; } 全部完成!現(xiàn)在必須編譯連接庫,然后將其拷貝到操作系統(tǒng)可以加載的目錄下。通常在WINDOWS里是系統(tǒng)變量的定義路徑。我個(gè)人使用的是MYSQL服務(wù)器的bin目錄。你必須確認(rèn)該目錄是其它MYSQL不能訪問的。然后確認(rèn)所有MYSQL需要的函數(shù)功能。 我們必須告訴MYSQL,這必須直接了當(dāng):執(zhí)行以下SQL指令: CREATE [AGGREGATE] FUNCTION MyTest RETURNS [INTEGER|STRING|REAL|DECIMAL] SONAME the_libraries_exact_name 現(xiàn)在你可以想使用其他函數(shù)一樣使用它了。 5)成員函數(shù): 現(xiàn)在說一下成員函數(shù)。當(dāng)你的UDF是你個(gè)成員函數(shù),你必須增加一些函數(shù),一些函數(shù)在不同的方式中使用。調(diào)用次序是: 調(diào)用yTest_init來分配內(nèi)存(就象一般的UDF一樣) MYSQL將表分類是通過GROUP BY 每組里的第一行調(diào)用MyTest_clear 每組里的第一列調(diào)用 MyTest_add 在組改變后或最后一列改變后調(diào)用MyTest得到結(jié)果 重復(fù)3到5直到所有列被處理。 調(diào)用MyTest_deinit清空內(nèi)存 現(xiàn)在讓我們看一下新的聚合函數(shù)所需的函數(shù)。該例中將簡(jiǎn)單的添加所有的值。(就象本地SUM函數(shù)) void MyTest_clear(UDF_INIT *initid, char *is_null, char *error) { /*為每個(gè)新組重新將總數(shù)設(shè)置為0,當(dāng)然你必須分配一個(gè)longlong類型變量在在init函數(shù)中,并分配給指針 */ *((longlong*)initid->ptr) = 0; } void MyTest_add(UDF_INIT *initid, UDF_ARGS *args, char *is_null, char *error) { //為每列將當(dāng)前值添加到總數(shù) *((longlong*)initid->ptr) = *((longlong*)initid->ptr) + *((longlong*)args->args[0]); } longlong MyTest(UDF_INIT *initid, UDF_ARGS *args, char *is_null, char *error) { //最后返回總值 return *((longlong*)initid->ptr); } 6)更進(jìn)一步的問題: 在你寫一些復(fù)雜的UDF時(shí)需要注意幾個(gè)問題: 一個(gè)字符串函數(shù)應(yīng)該返回一個(gè)指向結(jié)果的指針并且設(shè)置*result和*length作為目錄和返回值的長度值。例如: memcpy(result, "result string", 13); *length = 13; MyTest建立的結(jié)果緩沖區(qū)是255字節(jié)。如果你的結(jié)果保存在里面。你不必?fù)?dān)心結(jié)果的內(nèi)存分配問題。 如果你的字符串函數(shù)需要返回一個(gè)大于255字節(jié)長度的字符串。你必須用malloc或新的MyTest_init或MyTest函數(shù)分配,然后用MyTest_deinit釋放它。你能用UDF_INIT的指針保存分配的內(nèi)存地址,并在MyTest中重用。 在主函數(shù)中指定一個(gè)錯(cuò)誤返回,設(shè)置 *error為1:如果MyTest()為任何列將*error設(shè)置為1,則函數(shù)的值是NULL針對(duì)于當(dāng)前列,以及對(duì)任何的通過MyTest()被調(diào)用的聲明中并發(fā)的列請(qǐng)求。 想了解更多內(nèi)容看一下MYSQL在線幫助。 7)一些指導(dǎo)方針: 如果你確實(shí)希望你的UDF運(yùn)行良好,這里有一些建議:) 不要在UDF中調(diào)用任何其他的程序或進(jìn)程 不要保存任何的本地信息。(這些在普通的庫里已經(jīng)共享) 不要分配任何的全局或靜態(tài)的變量。 始終檢測(cè)成員的類型。就象MYSQL將所有類型都轉(zhuǎn)換為字符類型。如果你將一個(gè)字符類型轉(zhuǎn)換成整型指針可能會(huì)出錯(cuò)。 特別注意內(nèi)存的分配。如果你有內(nèi)存泄漏問題你會(huì)使服務(wù)器徹底崩潰! 8)調(diào)式UDF 調(diào)試UDF需要勇氣因?yàn)槿绻鸘DF有問題,每次都會(huì)使整個(gè)MYSQL服務(wù)器死掉。所以我寫了一個(gè)命令行工具,來圍繞這個(gè)問題工作。僅僅運(yùn)行它,它會(huì)模仿"SELECT"調(diào)用指令將結(jié)果保存到庫文件中,可以打印所有的結(jié)果行。所以當(dāng)UDF存在一些錯(cuò)誤只是該程序崩潰而不會(huì)是整個(gè)服務(wù)器。 | 
|  |