一. 網絡程序運行過程中的常見異常及處理
第1個異常是 java.net.BindException:Address already in use: JVM_Bind。
該異常發生在服務器端進行new ServerSocket(port)(port是一個0,65536的整型值)操作時。異常的原因是以爲與port一樣的一個端口已經被啓動,並進行監聽。此時用netstat –an命令,可以看到一個Listending狀態的端口。只需要找一個沒有被佔用的端口就能解決這個問題。
第2個異常是java.net.ConnectException: Connection refused: connect。
該異常發生在客戶端進行 new Socket(ip, port)操作時,該異常發生的原因是或者具有ip地址的機器不能找到(也就是說從當前機器不存在到指定ip路由),或者是該ip存在,但找不到指定的端口進行監聽。出現該問題,首先檢查客戶端的ip和port是否寫錯了,如果正確則從客戶端ping一下服務器看是否能ping通,如果能ping通(服務服務器端把ping禁掉則需要另外的辦法),則看在服務器端的監聽指定端口的程序是否啓動,這個肯定能解決這個問題。
第3個異常是java.net.SocketException: Socket is closed,
該異常在客戶端和服務器均可能發生。異常的原因是己方主動關閉了連接後(調用了Socket的close方法)再對網絡連接進行讀寫操作。
第4個異常是java.net.SocketException: (Connection reset或者Connect reset by peer:Socket write error)。
該異常在客戶端和服務器端均有可能發生,引起該異常的原因有兩個,第一個就是如果一端的Socket被關閉(或主動關閉或者因爲異常退出而引起的關閉),另一端仍發送數據,發送的第一個數據包引發該異常(Connect reset by peer)。另一個是一端退出,但退出時並未關閉該連接,另一端如果在從連接中讀數據則拋出該異常(Connection reset)。簡單的說就是在連接斷開後的讀和寫操作引起的。
第5個異常是java.net.SocketException: Broken pipe。
該異常在客戶端和服務器均有可能發生。在第4個異常的第一種情況中(也就是拋出 SocketExcepton:Connect reset by peer:Socket write error後),如果再繼續寫數據則拋出該異常。前兩個異常的解決方法是首先確保程序退出前關閉所有的網絡連接,其次是要檢測對方的關閉連接操作,發現對方關閉連接後自己也要關閉該連接。
二.編寫網絡程序時需要注意的問題
第1個問題是要正確區分長、短連接。所謂的長連接是一經建立就永久保持。短連接就是在以下場景下,準備數據—>建立連接— >發送數據—>關閉連接。很多的程序員寫了多年的網絡程序,居然不知道什麼是長連接,什麼是短連接。
第2個問題是對長連接的維護。所謂的維護包括兩個方面,首先是檢測對方的主動斷連(既調用 Socket的close方法),其次是檢測對方的宕機、異常退出及網絡不通。這是一個健壯的通信程序必須具備的。檢測對方的主動斷連很簡單,主要一方主動斷連,另一方如果在進行讀操作,則此時的返回值只-1,一旦檢測到對方斷連,則應該主動關閉己方的連接(調用Socket的close方法)。而檢測對方的宕機、異常退出及網絡不通常用方法是用“心跳”,也就是雙方週期性的發送數據給對方,同時也從對方接收“心跳”,如果連續幾個週期都沒有收到對方心跳,則可以判斷對方或者宕機或者異常推出或者網絡不通,此時也需要主動關閉己方連接,如果是客戶端可在延遲一定時間後重新發起連接。雖然Socket有一個keep alive選項來維護連接,如果用該選項,一般需要兩個小時才能發現對方的宕機、異常退出及網絡不通。
第3個問題是處理效率問題。不管是客戶端還是服務器,如果是長連接一個程序至少需要兩個線程,一個用於接收數據,一個用於發送心跳,寫數據不需要專門的線程,當然另外還需要一類線程(俗稱Worker線程)用於進行消息的處理,也就是說接收線程僅僅負責接收數據,然後再分發給Worker進行數據的處理。如果是短連接,則不需要發送心跳的線程,如果是服務器還需要一個專門的線程負責進行連接請求的監聽。這些是一個通信程序的整體要求,具體怎麼設計你的程序,就看你自己的設計水平了。
4 和zxccss的交互.因爲開始短連接的話,不用考慮到線程的同步問題.現在做長連接,如果多個線程訪問同一個 socket,這個全局的socket就需要進行資源保護,因爲算法庫是由zxccss的線程調用的,他的線程的運行機制我也不熟悉,發了郵件給 zxccss以前的作者李偉華,在深圳的李偉華雖然現在不做這個東西了,但是他很熱情的幫我聯繫到了現在負責這個東西的同事,這裏對他贊一個.後來問清了 zxccss的線程機制 ,用信號量的方法對全局長連接socket進行保護.修改代碼.
5 和華爲的交流問題,我不知道華爲的態度是什麼,反正感覺是他們對這個項目不是很重視,投入的人力精力都不夠,還好在各位同事的幫忙督促下,他們也在一點一點的做東西,其實中興華爲人家外面的人和稱"中華爲興",如果這個東西他們合作一些,至少可以在一半的時間內做好。我們做底層開發的還能做什麼?不過是把手頭的工作做好罷了.
6 這周和用服的三個同事同吃同住同勞動,感覺到這這邊的辛苦,沒有一天是2點前歲的,早上9點過又去了.通過和他們交流,我越來越感覺到個東西.大家都覺得現在的版本管理啊,項目升級啊有諸多的問題.我沒有接觸,感覺不深,但是這次這個zxcomsvr搞的我是很是鬱悶的.從開發的角度來說,除了平時大家負責一點,多想想自己的代碼,少出點bug外,我們這邊能不能建立一個bug數據庫這樣類似的東西,把開發,現場的bug想辦法放到數據庫中,以後遇到了,好去重現,或去修改,或者大家把自己遇到的問題,解決方法都放到裏面去,做個有效的搜索機制供別人使用,這自己雖然花的時間多了一點點,但是能爲後來的人節省很多的時間,這是我的一點不成熟的想法,只有個大概的概念。不過這種東西如果推廣,應該可以受到大家,特別是前方用服的歡迎的。
Socket 通信(發送&接收)
import java.net.*;
import java.io.*;
public class SocketClient {
private String hostName;
private int portNum;
private int delaySecond; // 發文接收返回報文延時
this.hostName = "192.168.0.1";
this.portNum = 7000;
this.delaySecond = 50000;
pFileOp = null;
}
Socket socket = null;
try {
socket = new Socket(hostName, portNum);
} catch (UnknownHostException e) {
System.out.println("-->未知的主機名:" + hostName + " 異常");
} catch (IOException e) {
System.out.println("-hostName=" + hostName + " portNum="
+ portNum + "---->IO異常錯誤" + e.getMessage());
}
return socket;
}
public String sendMessage(String strMessage) {
String str = "";
String serverString = "";
Socket socket;
try {
socket = getSocket();
// socket.setKeepAlive(true);
if (socket == null) { // 未能得到指定的Socket對象,Socket通訊爲空
return "0001";
}
PrintWriter out = new PrintWriter(socket.getOutputStream());
//log.info("---->發送報文="+strMessage);
out.println(strMessage);
out.flush();
BufferedReader in = new BufferedReader(new InputStreamReader(
socket.getInputStream()));
long sendTime = System.currentTimeMillis();
long receiveTime = System.currentTimeMillis();
boolean received = false; // 成功接收報文
boolean delayTooLong = false;
serverString = null;
while (!received && !delayTooLong) {
if (socket.getInputStream().available() > 0) {
// serverString = in.readLine();
char tagChar[];
tagChar = new char[1024];
int len;
String temp;
String rev = "";
if ((len = in.read(tagChar)) != -1) {
temp = new String(tagChar, 0, len);
rev += temp;
temp = null;
}
serverString = rev;
}
receiveTime = System.currentTimeMillis();
if (serverString != null)
received = true; // 字符串不爲空,接收成功
if ((receiveTime - sendTime) > delaySecond)
delayTooLong = true; // 接收等待時間過長,超時
}
in.close();
out.close();
if (delayTooLong) str="2190"; //超時標誌爲真,返回超時碼
if (!received) str ="2190";
socket.close();
} catch (UnknownHostException e) {
log.error("---->出現未知主機錯誤! 主機信息=" + this.hostName + " 端口號="
+ this.portNum + " 出錯信息=" + e.getMessage());
str = "2191";
// System.exit(1);
} catch (IOException e) {
log.error("---->出現IO異常! 主機信息=" + this.hostName + " 端口號="
+ this.portNum + " 出錯信息=" + e.getMessage());
e.printStackTrace();
str = "2191";
} catch (Exception e) {
str="2177";
log.error("---->出現未知異常" + e.getMessage());
} finally {
socket = null;
str.trim();
//log.info("--->返回的socket通訊字符串="+str);
return str;
}
}
A,B 連接得到服務器確認後
A承擔工作,發送接受命令與服務端通訊,同時每隔6秒發送心跳包到服務端
B承擔工作,接受服務端返回心跳包,30秒接受不到心跳包,判斷出連接斷開
網上很多寫自定義心跳實現長連接,卻沒有Java方面客戶端的代碼實現