分类目录归档:Java

中科院分词ICTCLAS5.0 配置错误处理

这个分词器调起来确实让人崩溃,今天想要把包名和dll文件换个路径,结果总是出现这样的问题:
Exception in thread “main” java.lang.UnsatisfiedLinkError: ictclas.NLPIR.NLPIR_Init([BI)Z

各种debug无果,后来发现包名改回kevin.zhang之后程序就好了。。大概是知识产权问题吧~下面转的是一个人总结的别的问题,希望大家少在调试工具上花费太多时间。
错误一:

配置路径如下:

运行ParagraphTest.java出现如下错误

Exception in thread “main” java.lang.UnsatisfiedLinkError: cn.yh.split.ICTCLAS50.ICTCLAS_Init([B)Z

at cn.yh.split.ICTCLAS50.ICTCLAS_Init(Native Method)

at cn.yh.split.Test.main(Test.java:19)

解决办法:

最开始尝试了很多方便,比如修改classpath,修改usr_path等,仍然会报错。后来将ICTCLAS50.java放在他给的例子里面有个包 ICTCLAS.I3S.AC下,结果运行正确。可能是开发ICTCLAS50为了保护版权考虑,如果不在package ICTCLAS.I3S.AC下就会报错。

错误二:

配置文件太多,包括Data和ICTCLAS50.dll等,我想把它放在一个特定的文件夹如ICTCLAS路径下。配置路径如下:

运行ParagraphTest.java出现如下错误

Exception in thread “main” java.lang.UnsatisfiedLinkError: no ICTCLAS50 in java.library.path

at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1709)

at java.lang.Runtime.loadLibrary0(Runtime.java:823)

at java.lang.System.loadLibrary(System.java:1030)

at ICTCLAS.I3S.AC.ICTCLAS50.<clinit>(ICTCLAS50.java:9)

at cn.yh.split.ParagraphTest.main(ParagraphTest.java:9)

解决办法:

很明显,这是由于java.library.path不正确,只需要将导入dll时使用load导入绝对路径即可。修改ICTCLAS50.java里面的System.loadLibrary(“ICTCLAS50”)为 System.load(new File(“”).getAbsolutePath()+”\\ICTCLASConf\\ICTCLAS50.dll”);

修改后运行又出现以下错误:

Init Fail!

Cannot Open Configure file .\Configure.xml

有错误可知,是由于找不到.\Configure.xml文件,需要将配置文件根目录设置为new File(“”).getAbsolutePath()+”\\ICTCLASConf”。在初始化ICTCLAS_Init时,将new File(“”).getAbsolutePath()+”\\ICTCLASConf”.getBytes(“GB2312”)作为参数传递就可以正确运行了。

错误三:

若修改后运行仍然出现错误:

Init Fail!

刷新项目,发现根目录多了一个ICTCLAS.log的文件,打开文件内容,能够得到错误信息:

Default Path : .

start lic check.

License file .\user.lic can not open!

表示还需要user.lic也再根目录下面。将user.lic一道根目录下。

修改后运行在此出现错误:

Init Fail!

重新打开ICTCLAS.log文件,得到错误信息:

Default Path : .

start lic check.

License succeed!Failed to open .\Data\character.idx

Cannot open file .\Data\character.idx.

则表示没有找到Data文件夹,由于我们将Data放在了ICTCLASConf目录,故需要设置Configure.xml的<DataPath>Data</DataPath>//Data文件夹路径一项为指定目录。

百度搜索结果链接转实际链接

转自:http://enenba.com/?post=237

好像从9-1开始,百度搜索结果网址的链接又开始变成这样了,”link?url=…….”,是老长老长的。自己官方SEO手册说要简短URL,什么不超过128个字符。都是浮云,看这下面一个搜索结果
我的“enenba”的搜索结果(2012-9-3)第一个网址就是

'http://www.baidu.com/link?url=ab848a4ebf3b154d5a26b46af889a39ac4eed0923116bcf0318bb786a19e417e714ea3b262d4ef8546b80f8d6cffdd1552a3595fad2084b2b04cf1a10c36485f8a3f73ced8eee0c4f9284ad8daefcb15794a404724dc8678af321201bce1cf69814e1920005bc796e241dcc9c45664d62bb227b184af812305040ecc1bab45fff26deb422fc77779a618a28d269f82c2a58db607e54d3abcff2e6a43376ae429f1088b77dbde4b1348c11ea7c7e88ec03ce7484d89fe244390e628bc04b824e78dc62f0d12df46f100fcd70a1cc2783360150eaee4b9b6928700cb776e5b84abc69565c04e97800c615c84e640fb7b971cdd88ca6478f8d07a28058dd50ab7879c3340ad84d7c6e9fb779710a060cc6d26cbdb0ab7e7f8b70ffd77e025470569f0be3580991c83d6db4b78c2f7e75713c73c8683feebeded81088e8706b23c64747f20084e726f0de41906254a0f0983430a990861e8ddd9fd1d832b872aebac5573358cc3c0659257bfcf54763ec1c5ecff3b3fbd1d4c'

目前还是找不到什么规律的,不过想要得到跳转后的网址也不难。
我又挖了以前的文章了:

 

 

<?php
/*
	getrealurl 获取301、302重定向后的URL地址  by enenba.com
	@param str $url 查询
	$return str  定向后的url的真实url
 */
function getrealurl($url){
	$header = get_headers($url,1);
	if (strpos($header[0],'301') || strpos($header[0],'302')) {
		if(is_array($header['Location'])) {
			return $header['Location'][count($header['Location'])-1];
		}else{
			return $header['Location'];
		}
	}else {
		return $url;
	}
}


//恶心的一长串字符
$url = 'http://www.baidu.com/link?url=ab848a4ebf3b154d5a26b46af889a39ac4eed0923116bcf0318bb786a19e417e714ea3b262d4ef8546b80f8d6cffdd1552a3595fad2084b2b04cf1a10c36485f8a3f73ced8eee0c4f9284ad8daefcb15794a404724dc8678af321201bce1cf69814e1920005bc796e241dcc9c45664d62bb227b184af812305040ecc1bab45fff26deb422fc77779a618a28d269f82c2a58db607e54d3abcff2e6a43376ae429f1088b77dbde4b1348c11ea7c7e88ec03ce7484d89fe244390e628bc04b824e78dc62f0d12df46f100fcd70a1cc2783360150eaee4b9b6928700cb776e5b84abc69565c04e97800c615c84e640fb7b971cdd88ca6478f8d07a28058dd50ab7879c3340ad84d7c6e9fb779710a060cc6d26cbdb0ab7e7f8b70ffd77e025470569f0be3580991c83d6db4b78c2f7e75713c73c8683feebeded81088e8706b23c64747f20084e726f0de41906254a0f0983430a990861e8ddd9fd1d832b872aebac5573358cc3c0659257bfcf54763ec1c5ecff3b3fbd1d4c';

$url = getrealurl($url);
echo 'enenba真实的url为:'.$url;


?>

看到百度再怎么301跳转我都可以找得到。

 

end

JBoss7如何设置URI编码,JBOSS7中文乱码解决

参考链接:http://www.oschina.net/question/144480_61449
在Jboss home下面jboss-as-7.1.1.Final\standalone\configuration的standalone.xml文件中 <extensions> </extensions> 节点之后插入如下:
<system-properties>
<property name=”org.apache.catalina.connector.URI_ENCODING” value=”UTF-8″/>
<property name=”org.apache.catalina.connector.USE_BODY_ENCODING_FOR_QUERY_STRING” value=”true”/>
</system-properties>

HttpClient超时设置

DefaultHttpClient:
请求超时
httpclient.getParams().setParameter(CoreConnectionPNames.CONNECTION_TIMEOUT, 60000);
读取超时
httpclient.getParams().setParameter(CoreConnectionPNames.SO_TIMEOUT, 60000);

HttpClient
HttpClient httpClient=new HttpClient();
链接超时
httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(60000);
读取超时
httpClient.getHttpConnectionManager().getParams().setSoTimeout(60000)

HttpClient中文乱码的两种解决方案

引用:http://blog.csdn.net/roseey/article/details/5740279

最近使用HttpClient读取页面出现中文乱码问题,解决问题后写出本文章,希望能对大家有所帮助。

问题描述:HttpClient所读取的页面为UTF-8格式,使用如下方法读取后出现乱码问题,将读取内容转码无效。

 

public static String getHttpResponse(String url)
{
String result = null;
try{

HttpClient httpClient;
GetMethod getMethod;
httpClient = new HttpClient();
getMethod = new GetMethod(url);
getMethod.getParams().setParameter(“http.method.retry-handler”, new DefaultHttpMethodRetryHandler());
int statusCode = httpClient.executeMethod(getMethod);
if(statusCode == 200)
{
StringBuffer temp = new StringBuffer();
InputStream in = getMethod.getResponseBodyAsStream();
BufferedReader buffer = new BufferedReader(new InputStreamReader(in));
for(String tempstr = “”; (tempstr = buffer.readLine()) != null;)
temp = temp.append(tempstr);

buffer.close();
in.close();
result = temp.toString().trim();
} else
{
System.err.println((new StringBuilder(“Can’t get page:”)).append(url).append(“#”).append(getMethod.getStatusLine()).toString());
}
}catch(Exception e){
e.printStackTrace();
}
return result;
}

 

通常解决HttpClient乱码的一种方式是在读取时设置读取的编码,如:

httpClient.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET, “UTF-8″);

但如果当前环境的默认编码不是”UTF-8″,这样也会有问题,因为在  BufferedReader buffer = new BufferedReader(new InputStreamReader(in));一句中,InputStreamReader将读入内容解码为平台默认编码,这样往往我们读入的内容第一时间就被转为乱码,之后可能我们无论再怎么转都不是所需的内容。对于这种情况,解决办法是设置InputStreamReader的指定编码,即:

BufferedReader buffer = new BufferedReader(new InputStreamReader(in,”UTF-8”));

JNDI连接数据库

一、数据源简介:
***********************************************************************************
在Java语言中,DataSource对象就是一个代表数据源实体的对象。一个数据源就是一个用来存储数据的工具,它可以是复杂的大型企业级数据库,也可以是简单得只有行和列的文件。数据源可以位于在服务器端,也可以位于客服端。

应用程序通过一个连接来访问数据源,那么一个DataSource对象就是用于提供连接数据源的工具。DataSource接口提供了两个方法用于建立和数据源的连接
使用DataSource对象建立和数据库的连接比起使用DriverManager接口更加高效,虽然两者的使用范围都很相似,并且都提供了方法用于建立和数据库的连接,设置连接的最大超时时间,获取流、登录。

但两者之间的区别更加明显。和DriverManager不同,一个DataSource对象能够识别和描述它所代表的数据源的属性,而且DataSource对象的工作和JNDI(Javatm Naming and Directory Interfaceti)具有密切的关系,DataSource的建立、发布、独立于应用程序的管理都依靠JNDI技术。

在JDBC2.0或JDBC3.0中,所有的数据库驱动程序提供商必须提供一个实现了DataSource接口的类,要使用数据源必须首先在JNDI中注册该数据源对象。
如果在JNDI中注册了数据源对象,将会比起使用DriverManager来具有两个方面的优势:
首先程序不需要像使用DriverManager一样对加载的数据库驱动程序信息进行硬编码,程序员可以选择先在JNDI中注册这个数据源对象,然后在程序中使用一个逻辑名称来引用它,JNDI会自动根据你给出的名称找到与这个名称绑定的DataSource对象。然后就可以使用这个DataSource对象来建立和具体数据库的连接了。

其次,使用实现了DataSource接口的类所具有的第二个优势体现在连接池和分布式事务上。连接池通过对连接的复用而不是新建一个物理连接来显著地提高程序的效率。从而适用于任务繁忙、负担繁重的企业级分布式事务。
***********************************************************************************

二、JNDI简介:
***********************************************************************************
JNDI是用于向Java程序提供目录和命名功能的API。它被设计成独立于特定的目录服务,所以各种各样的目录都可以通过相同的方式进行访问。

可以简单地把JNDI理解为一种将对象和名字绑定的技术,对象工厂负责生产出对象,这些对象都和惟一的名字绑定。外部程序可以通过名字来获取对某个对象的引用。

在Intranets(企业内部网)和Internates(互联网)中目录服务(Directory service)扮演了一个非常重要的角色,它能够在众多的用户、机器、网络、服务、应用程序中访问各种各样的信息。目录服务提供了一系列的命名措施,用人类可以理解的命名方式来刻画各种各样的实体之间的关系

一个企业式计算环境(computing environment)通常是由若干代表不同部分的命名复合而成。比如在一个企业级环境中DNS(Domain Name System)通常被当成顶层的命名方案(top-level namein facility)区分不同的部门或组织。而这些部门或组织自己又可以使用诸如LADP或NDS的目录服务

从用户的角度来看,这些都是由不同的命名方案构成的复合名称。URL就是一个很典型的例子,它由多个命名方案构成。使用目录服务的应用程序必须支持这种复合构成方式

使用目录服务API的Java开发人员获得的好处不仅在于API独立于特定的目录或命名服务,而且可以通过多层的命名方案无缝访问(seamless acess)目录对象。实际上,任何的应用程序都可以将自身的对象和特定的命名绑定起来,这种功能可以使到任何的Java程序查找和获取任何类型的对象

终端用户可以方便地使用逻辑名称从而轻易地在网络上查找和识别各种不同的对象,目录服务的开发人员可以使用API方便地在不同的客服端之间切换而不需要作任何更改
***********************************************************************************

三、数据源和连接池的关系:
***********************************************************************************
JDBC2.0提供了javax.sql.DataSource接口,它负责建立与数据库的连接,在应用程序访问数据库时不需要编写连接数据库的代码,可以直接从数据源获得数据库连接。

在DataSource中事先建立了多个数据库连接,这些数据库连接保存在连接池(Connect Pool)中。Java程序访问数据库时,只需要从连接池中取出空闲状态的数据库连接;当程序访问数据库结束,再将数据库连接放回连接池。
***********************************************************************************

四、数据源和JNDI的关系:
***********************************************************************************
DataSource对象是由Tomcat提供的,因此不能在程序中采用创建一个实例的方式来生产DataSource对象,而需要采用Java的另一个技术JNDI,来获得DataSource对象的引用。

Tomcat把DataSource作为一种可以配置的JNDI资源来处理。生成DataSource对象的工厂为org.apache.commons.dbcp.BasicDataSourceFactory。

在javax.naming包中提供了Context接口,该接口提供了将对象和名字绑定,以及通过名字检索对象的方法。Context中的主要方法有:
bind(String name,Object object):将对象与一个名字绑定
lookup(String name):返回与指定的名字绑定的对象
***********************************************************************************

五、Tomcat中数据源的配置:
***********************************************************************************
数据源的配置涉及修改server.xml和web.xml,在server.xml中加入定义数据源的元素<Resource>,在web.xml加入<resource-ref>元素,声明该Web应用所引用的数据

A.在server.xml中加入<Resource>元素:<Resource>元素用来定义JNDI Resource。

属性 描述
name 指定Resource的JNDI名字
auth 指定管理Resource的Manager,它有两个可选值:Container、Application
type 指定Resource所属的Java类名

<Resource name = “jdbc/BookDb”
auth = “Container”
type = “javax.sql.DataSource” />

B.在<Resource>元素中加入<ResourceParams>元素:<ResourceParams>元素用来指定各种参数值

属性 描述
factory 指定生成的DataResource的factory类名
maxActive 指定数据库连接池中处于活动状态的最大连接数目,0表示不受限制
maxIdle 指定数据库连接池中处于空闲状态的最大连接数目,0表示不受限制
maxWait 指定连接池中连接处于空闲状态的最长时间,超过会抛出异常,-1表示无限
username 指定连接数据库的用户名
password 指定连接数据库的口令
driverClassName 指定连接数据库的JDBC驱动程序
url 指定连接数据库的URL

<ResourceParams name = “jdbc/BookDb”>

<parameter>
<name>factory</name>
<value>org.apache.commons.dbcp.BasicDataSourceFactory</value>
</parameter>

<parameter>
<name>maxActive</name>
<value>100</value>
</parameter>

<parameter>
<name>maxIdle</name>
<value>30</value>
</parameter>

<parameter>
<name>maxWait</name>
<value>10000</value>
</parameter>

<parameter>
<name>username</name>
<value>user</value>
</parameter>

<parameter>
<name>password</name>
<value>1234</value>
</parameter>

<parameter>
<name>driverClassName</name>
<value>com.mysql.jdbc.Driver</value>
</parameter>

<parameter>
<name>url</name>
<value>jdbc:mysql//localhost:3306/BookDb?autoReconnect=true</value>
</parameter>

</ResourceParams>

C.在web.xml中加入<resource-ref>元素:<resource-ref>元素表示在Web应用中引用JNDI资源

属性 描述
description 对所引用的资源的说明
res-ref-name 指定所引用资源的JNDI名字,与<Resource>元素中的name属性对应
res-type 指定所引用资源的类名字,与<Resource>元素中的type属性对应
res-auth 指定所引用资源的Manager,与<Resource>元素中的auth属性对应

***********************************************************************************

六、在Web应用中使用数据源:
***********************************************************************************
javax.naming.Context提供了查找JNDI Resource的接口,可以通过三个步骤来使用数据源对象:

A.获得对数据源的引用:
    Context ctx = new InitalContext();
DataSource ds = (DataSource)ctx.lookup(“java:comp/env/jdbc/BookDb”);

B.获得数据库连接对象:
Connection con = ds.getConnection();
  
C.返回数据库连接到连接池:
con.close();

在连接池中使用close()方法和在非连接池中使用close()方法的区别是:前者仅仅是把数据库连接对象返回到数据库连接池中,是连接对象又恢复到空闲状态,而非关闭数据库连接,而后者将直接关闭和数据库的连接
***********************************************************************************

七、发布使用数据源的Web应用:
***********************************************************************************
如果直接同JDBC访问数据库,可以把JDBC驱动程序拷贝到Web应用的WEB-INF/lib目录或者Tomcat安装目录下的common/lib目录下。

如果通过数据源访问数据库,由于数据源由Servlet容器创建并维护,所以必须把JDBC驱动程序拷贝到Tomcat安装目录下的common/lib目录下,确保Servlet容器能够访问驱动程序。

Jboss7.1添加Module,添加jar,增加外部jar,即module的添加

网上关于jboss的资料太少了,特别是module这块,真蛋疼

在$JBOSS_HOME/modules 下建立comwave\crm\main在main目錄下建立module.xml並將jacob.jar放在此目錄下

module.xml的內容如下:

<?xml version=”1.0″ encoding=”UTF-8″?>

<module name=”comwave.crm” xmlns=”urn:jboss:module:1.1″>

  <resources>

    <resource-root path=”jacob.jar” />

  </resources>

</module>

在$JBOSS_HOME/standalone/configuration下的standalone.xml的<subsystem xmlns=”urn:jboss:domain:ee:1.0″>節點加入

 <global-modules>

                <module name=”comwave.crm” slot=”main”/>

            </global-modules>

完整subsystem如下:

<subsystem xmlns=”urn:jboss:domain:ee:1.0″>
<global-modules>
<module name=”org.apache.httpcomponents” slot=”main”/>
</global-modules>
</subsystem>

將jacob-1.14.3-x86.dll放在$JBOSS_HOME/bin(如果系統為64位放jacob-1.14.3-x64.dll),重啟JBOSS問題解決

PS:注意上述的藍色部分,modulename main之前的目錄路徑一致

Jboss as 7 添加mysql数据库配置文件 datasource

JBOSS AS 7.1发布了,今天研究了一下,果然像官方说的一样,速度比jboss4, 6确实快了很多,我I5电脑3秒就能启动完。不过新东西就是没中文的,得自己看英文网。下面我给出第一手资料,这里一扁英文的文章,我也参考了这文章。地址:

https://zorq.net/b/2011/07/12/adding-a-mysql-datasource-to-jboss-as-7/

其实也是比较简单的,主要有下面5步,这里只谈及以组件(module)方式创建:

1、创建文件夹:%JBOSS_HOME%/modules/com/mysql/main

2、COPY相应的JAR包到上面创建的目录下,这里使用的是:mysql-connector-java-5.1.18-bin.jar

3、在相同目录下创建module.xml,内容如下:

<?xml version=”1.0″ encoding=”UTF-8″?>

<module xmlns=”urn:jboss:module:1.0″ name=”com.mysql”>
<resources>
<resource-root path=”mysql-connector-java-5.1.18-bin.jar”/>
</resources>
<dependencies>
<module name=”javax.api”/>
</dependencies>
</module>

现在%JBOSS_HOME%/modules/com/mysql/main目录下已经有了两个文件:

module.xml

mysql-connector-java-5.1.18-bin.jar

4、修改JBOSS_HOME/standalone/configuration/standalone.xml文件,说明驱动使用相关信息;在standalone.xml文件中找到drivers元素(节点,element ),并添加以下内容(红色部分):

<drivers>
<driver name=”mysql” module=”com.mysql”/>
<driver name=”h2″ module=”com.h2database.h2″>
<xa-datasource-class>
org.h2.jdbcx.JdbcDataSource
</xa-datasource-class>
</driver>
</drivers>

5、在在standalone.xml文件中找到datasources元素,并在当中加入以下内容:

<datasources>
<datasource jndi-name=”java:/mydb” pool-name=”my_pool” enabled=”true” jta=”true” use-java-context=”true” use-ccm=”true”>
<connection-url>
jdbc:mysql://256.256.256.256:3306/mydb
</connection-url>
<driver>
mysql
</driver>
<security>
<user-name>
root
</user-name>
<password>
root
</password>
</security>
</datasource>

 

(转载请注明:原文,http://hi.baidu.com/kittopang/blog/item/5a94c3f833f9ef979e51468d.html)

至此,我们的工作已经完成。

你会在控件台看到大概以下信息:

JBAS010400: Bound data source [java:jboss/datasources/ExampleDS]

JBAS010400: Bound data source [java:/mydb]

JBoss远程连接报错

WARN: Could not register a EJB receiver for connection to remote://192.168.0.200:4447
java.lang.RuntimeException: javax.security.sasl.SaslException: Authentication failed: all available authentication mechanisms failed

 

解决方法:

In

1
<subsystem xmlns="urn:jboss:domain:security:1.1">

element,
inside

1
<login-module code="RealmUsersRoles" flag="required">

add this element

1
<module-option name="unauthenticatedIdentity" value="guest"/>

if not present.