我有以yyyymmdd结尾的文件名,例如:myFile.20090601、myFile20090708等
我想在2009年6月8日到7月7日的所有文件中搜索一个模式,即:20090609到20090707
我如何一次完成正则表达式
我试过:
grep 'myPattern' *20090(6(09|[1-3][0-9])|70[1-7])
或
取决于你的意思是7月8日还是9日(你的问题似乎有点矛盾)。有效日期的范围是6月6-30日,7月1-07日。由于天数的范围不同,我们应该为每个月使用单独的
有人能帮我使用正则表达式吗
基本上,我有一个搜索表单,用户键入他们想要搜索的任何关键字,当单击搜索按钮时,搜索关键字将附加到url(参见下面的示例)。注意:关键字可以包含任何字符
例1
搜索键:任何你想要的
URL:www.example.com/search/whatever+你想要的/
例2
搜索键:哦,孩子!发生什么事?
网址:www.example.com/search/oh+boy+%3F上发生了什么事
我可以使用什么正则表达式来捕获ASCII表中32到126之间的所有字符?在perl
是否有一个单数正则表达式可以在文本编辑器的搜索/替换对话框中用于颠倒列表中项目的顺序
例如,以以下列表为例:
第一项
第二项
第三项
在文本编辑器(如EditPad)中选择它,打开“搜索和替换”框,应用正则表达式(是否作为循环运行)并将其转换为:
第三项
第二项
第一项
这可以做到吗?正则表达式不能做到这一点
我建议使用像Perl这样的语言,您可以使用正则表达式来拆分列表并以相反的顺序将其写回。从技术上讲不是正则表达式,但有一个sed一行代码可以反转输入行():
以及一个vi命令来反转当
标签: Regex
negative-lookahead
我有一个字符串,我想从中挑选出子字符串,并以加号结束
例如:
text +name+ filler with /+ sign +b+ bold text +/b+
我想选择+名称++b++和+/b++,但我当前的正则表达式将+符号+视为一个可能的值”
这是我正在使用的正则表达式\+[\-@\w\s\d\/\!]*\+
我尝试在前面添加一个[^/],但这会添加+之前的任何字符,并且无法处理+n++b++
我试图找出lookaround和lookback,只是不确定如何应用它。负lookback看
所以正则表达式在我的技能中有点失败。我可以创建一些非常基本的搜索表达式,但在进行搜索和替换时,我失败了
如果这有帮助的话,我的文本编辑器是TextMate,但是这对于文本编辑器来说应该是相当通用的
我在TextMate中打开了一个CSV文件。我需要删除所有电话号码中的空白。电话号码的格式为:dddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd
我正在使用一个正则表达式,比如
<cfset a = ReFind("DESCRIBE\+[^>]*>", myResult.Header, 1, true) />
如果需要,此正则表达式在计算LEN和Position值时不应包含descripe+。我该怎么写呢?descripe+是9个字符,你能不能把这个数字加/减,然后算算。
<cfset a = ReFind("DESCRIBE\+([^>]*>)", myResult.Header, 1,
我需要帮助形成一个正则表达式来检查输入字符串是否只有模式1或2个字母(可以是小写或大写),后跟1或2个数字。有效字符串应该是d1、d15、ha1、ha20等等 以下操作应满足您的要求:
\A[a-zA-Z]{1,2}\d{1,2}\z
[a-zA-Z]是匹配任何字母的字符类,\d相当于[0-9]并匹配任何数字,{1,2}表示“重复上一个元素1或2次”
\A和\z是定位点,它们分别只在字符串的开头和结尾匹配(它们不匹配任何字符,它们只要求字符串在其开头或结尾以允许匹配)
您通常还会看到锚点^和$
我需要为单词创建正则表达式,而不是以点开头,它可能包含任何字母表、空格和点
样本,样本,测试,样本测试
正则表达式不应允许.sample、sample、sample.test
如何为此生成正则表达式?使用此
\b\p{L}[\p{L}\s.]*\b
解释
@"
\b # Assert position at a word boundary
\p{L} # A character with the Unicode property “letter” (any
我正在根据满足以下要求的字符串构建正则表达式:
该字符串最多有5组字母数字字符
字符串中的每个集合由单个空格字符分隔
例如,我们可以使用“asa22dasdcac3”或“Asdcd234 sacasW2 sas1 s sd1”(希望您能理解)。到目前为止,我已经:
^[A-z 0-9]\s{0,1}
我没有使用\w,因为它允许下划线。这适用于一组字符,但我需要允许五组相同类型的字符串用空格分隔
我该怎么做呢?你还没有说你在用什么语言,但这应该可以帮你:
^[A-Za-z0-9]+(\s[A-Z
我希望能够让用户输入:
./script.sh server[01-10]type
我已经得到了这个工作,并与[a-z]或[0-99]或无论它的数字有多高。虽然我真的不确定我是否做得对,是否有更简单的方法做同样的事情
想要检查是否有一种更简单的方法来做类似的事情,以及拥有多个通配符输入有多容易,如:
./script.sh (server|web)[01-10][a-z]
然后它将解析web01-10a-z或server01-10a-z并列出所有服务器
这是我到目前为止所做的,我承认我需要整
我正在玩一些正则表达式,在查看一些匹配项时,我开始好奇为什么exec函数会产生如此多的结果
我只是想澄清一下这个操作的内部工作原理,这样我就可以更轻松地理解为什么正则表达式返回n个结果,而不是仅仅接受它返回的结果
前
在上面的例子中,我得到了为什么它匹配“Zip或City&State”,但我不知道为什么第二个匹配会产生一个未定义的值
提前感谢。我不熟悉常规证明,但它看起来好像一次只返回一个匹配项。您看到的结果是:
“Zip或City&State”-完整匹配的子字符串
未定义-由捕获的子字符串(
标签: Regex
textmateoniguruma
我正在尝试做一个简单的查找和替换。我有:
<?php $url = 'http://www.mywebsite.net/this-is-a-page.php'; ?>
作为每个页面上的变量,我将其替换为:
<?php $url = curPageURL(); ?>
我的发现是这样设置的:
<?php $url =( .*); ?>
但这显然是错误的,因为当我点击find时,它不会返回任何结果。任何帮助都将不胜感激
谢谢 您需要转
我面临一个关于regexp的有趣问题,我在一个小型sed脚本(bash)中使用它,
这是:
cities="new york;milan;rome;paris;london"
echo ${cities} | sed 's/new.*;//'
这张照片是:伦敦
基本上,脚本会在最后一个分号出现之前替换所有内容,而我只想在第一个分号出现之前删除与(new.*)匹配的内容
有什么建议吗?您需要进行非贪婪替换:
sed 's/new[^;]*;//'
如果数据字符串不以分号结尾,则此操作无效。在
我使用Pig来处理数据
我的数据如下所示:
<?xml version="1.0" encoding="UTF-8"?><MC><SC><S uid="1" gen="" art="Samsung" cmp="<unknown>" fld="/mnt/sdcard/Samsung/Music" alb="Samsung" ttl="Vacation"/><S uid="2" gen="" art="Samsung"
我的字符串看起来像:
Especificação do Título
GRND3 - GRENDENE
GRND3 - GRENDENE
POSI3 - POSITIVO INF
我需要把GRND3,GRND3,POSI3分成3组
有什么表达式我可以轻松地完成吗?没有指定特定语言的问题是,^可能表示行的开头或文本的开头
如果^表示行的开始:
"^(\w+) -"
应该包括在内。然后得到第一组(同样是特定于语言的)
如果^表示文本开始(在上述情况下也适用):
"^(\w+) -"
在不
一月份,我问如何替换字符串的前N个点:
德温的回答很有帮助。它能被推广吗
df.1 <- read.table(text = '
my.string other.stuff
1111111111111111 120
..............11 220
11.............. 320
1............... 320
.......1........
我需要一个正则表达式,它可以验证十进制(18,3),表示精度为18,刻度为3
它需要通过以下标准:
逗号前的最大位数为15
逗号后的最大位数为3
有效示例:
123456789.123
123456789123456.12
12345.1
123456789123456
无效示例:
123456789234567
123.1234
1.12345
.1234
我怎样才能做到这一点呢?试试这个
String str="Your input";
Pattern pattern =
我有这根绳子
<div style='text-align:center;padding-top:6px;'>Displaying Result 1 - 10 of 10 Matching Services</div>
有人能帮我吗
您不需要引用=~的rhs
您可以使用BASH\u REMATCH变量获得所需的值
尝试:
从:
BASH\u重赛
一种数组变量,其成员由=~二进制运算符分配给[条件命令(参见条件构造)。
索引为0的元素是字符串中与
整个正则表达式。索引为n
我们有一套正则表达式,用于验证电子邮件,效果很好。尽管我们最近发现电子邮件地址中是否有点(.),但如果点(.)后面的字符数小于3,则正则表达式验证将失败。例如:
测试。abcd@gmail.com->通过
测试。abc@gmail.com->通过
测试。ab@gmail.com->失败
测试。a@gmail.com->失败
以下是正则表达式:
/^[-a-z0-9#$%^&'`?{}_=+\/}{\'?]+(\.[-a-z0-9#$%^&'`?{}_=+\/}{\'?]+([
我正试图通过Yahoo Pipes运行Google新闻查询,它会生成一个有效的URL,我仍然可以将其复制到浏览器中以获取RSS提要的代码(因此我知道特殊字符被正确翻译等),但当Pipes尝试读取URL时,通常会出现错误
This Pipe ran successfully but encountered some problems:
warning Error fetching
https://news.google.com/news?hl=en&q= ...etc... output
我有一个正则表达式来检查HH:MM:SS格式的时间戳:
(20|21|22|23|[01]\d|\d)(([:][0-5]\d){1,2})
但是我想忽略前面带有“runtime=”的时间戳
这可以用正则表达式来完成吗?一个负前瞻可以:
^(?!run time = ).*?(20|21|22|23|[01]\\d|\\d)(([:][0-5]\\d){1,2})
将Tuga建议的负前瞻与CAustin建议的HH:MM:SS正确解析相结合,并添加一个捕获组,以便您可以仅提取HH:MM:SS部
我有以下程序要获取
“计划”、“非自动化”、“st3reporter”、“功能性”、“每2小时最多报告3次”、“st3节流cdb”
**这些值来自字符串**
import re
string='''
import org.testng.Assert;
import org.testng.annotations.AfterMethod;
import org.testng.annotations.BeforeMethod;
import org.testng.annotations.Test;
我有一份表格文件:
#some header text
a 1 1234
b 2 3333
c 2 1357
#some header text
a 4 8765
b 1 1212
c 7 9999
...
在n行数据块中重复数据,数据块之间用一个空行隔开(可能还有一些其他标题文本)。我只对第三个专栏感兴趣,我想做一些grep、cut、awk、sed、paste magic来将其转化
如何在javascript中使用正则表达式在不同操作系统中检索数据时间戳路径
下面是一个例子
D:\\deploy\\logs\\uat\\20140929101121\\build1.log
//usr//bin//app1//log//dev//20140929100730//build2.log
//usr//bin//app1//log//dev//20140929100728//build1.log
我想检索
20140929101121
20140929100730
20140929
有这个字符串:
"example( other(1), 123, [25]).othermethod(456)"
如何仅捕获主要函数的参数:
"other(1), 123, [25]" and "456"
我正在尝试:
在html示例中。具有以下特征:
<div>
<div>
<div>12</div>
<div>34</div>
</div>
</di
我有3个xml标记,在1个字符串中具有相同的标记名:
<Name>Case1</Name> <Name>Case2</Name><Name>Case3</Name>
Case1 Case2Case3
我想使用正则表达式提取每个节点的内容。这是我到目前为止尝试过的regexp
(<Name>)(.*)(<\/Name>)
()(*)()
但这与预期不符。它匹配整个字符串
Case1 Case2C
目前,我正在通过为nginx定义以下服务器块将所有http流量路由到https
server {
listen 80;
server_name someserver.xyz www.someserver.xyz;
rewrite ^ https://someserver.xyz$request_uri? permanent;
}
server {
listen 443;
server_name someserver.xyz;
location / {
proxy
我想知道,用于测试德国文化中正确数字格式的正则表达式会是什么样子
在德语中,逗号用作小数点,点用于分隔千
因此:
1.000等于1000
1000等于1
1.000,89等于1000.89
1.000.123.456,89等于1000123456.89
在我看来,真正的诀窍是确保可以有几个点,可以选择后跟逗号分隔符
^(\d+\.)*\d+(,\d+)?
一个好的正则表达式应该是这样的
Regex regex = new Regex("-?\d{1,3}(?:\.\d{3})*(?:,\d
我对regex不熟悉。我正试图得到只有0.0的行
我想抓住这根绳子
3/6/7 56 0.0 0 0 5 0.00
但不是这个
3/6/7 56 1.0 0 0 5 0.00
我已经尝试了^.*0\.0正则表达式,但不幸的是,两个字符串都匹配。您需要转义点,因为它在正则表达式中表示“任何字符”。为了只匹配具有一个引用的行,可以使用负前瞻
^.*0\.0(?!0\.0)
looksHeads和behinds并不是在所有的正则表达式环境中都能工作,所
我无法从一个长网址的单元格中提取文本。它的长度各不相同,但我要查找的文本始终遵循&REQNO=。这是一个看起来像ABC-ABC-2015-0001的数字。我想使用Visual Basic进行此操作,但尝试了regex功能却没有效果。数据位于A1,在另一个单元格中输入:
=MID(A1,FIND("&REQNO=",A1)+LEN("&REQNO="),9999)
谢谢您的回复!它似乎起作用了,但它也在我的字符串后面拉数据。有没有办法在一定数量的字符后将其删除?我修复了它,我将9
如何创建可以更改此设置的mod_重写规则:
exampledomain/blog/2013/10/?view=flipcard&m=1&\u转义\u片段
为此:
exampledomain/blog/2013/10/
这是:
exampledomain/blog/review of items/?view=timeslide&m=1
为此:
exampledomain/blog/review of items/
基本上是检查最后一个字符串内部是否有m=1,并且只删除最后一个字符串,而不考虑之前的
要拒绝一些滥用有效引用攻击特定url的垃圾邮件发送者,我需要一个regexp规则来拒绝所有google.*referes-To/some/target/url
以下是我尝试过的:
location ^~ /some/target/url {
if ($http_referer ~ (.*)google(.*))
{ return 400;
}
}
更新:
在上面的规则中,我想要避免的是所有的google.*引用者,例如
google.com
google.de
google.
我正在使用Perl尝试从字符串中提取IP地址和端口
我尝试使用的正则表达式是:
s/(sip:)(;.*)//
字符串是:
sip:255.255.255:8080;传输=TCP
sip:255.255.255:8080
显然,我的正则表达式替换不起作用。有人能告诉我如何编写正则表达式吗?我想从这两条线中得出以下结论:
255.255.255.255:8080
这意味着正则表达式需要匹配任何不是该字符串的内容,并用nothing替换它
注意:IP地址和端口每次都会不同。它不是防弹的,但应
我们在课堂上讨论sed,我想知道sed使用正则表达式引擎的方式。每个程序(sed、awk、grep等)是否使用一个已编程到其中的正则表达式引擎,或者是否有一个正则表达式引擎工具/库/函数供开发sed、grep等的个人在其代码中实现?引擎是否内置在操作系统中,然后由使用它的工具调用?我想知道这将帮助我了解regex所达到的标准化水平。
谁创造了你,regex引擎?源代码在哪里?默认情况下,sed和grep都理解GNU基本正则表达式符号,它是POSIX基本正则表达式标准的一个实现。POSIX只是Un
我需要找到带有特殊单词的文件夹名称。我的代码不起作用。有人能告诉我怎么解决吗。
我希望文件夹名有或没有()都可以。我不知道毯子里有多少个数字。例如:
C:\test\REG33006\2017-03-09
C:\test\REG33006\2017-03-09(1)
C:\test\REG33006\2017-03-09(100)
在vb中有我的代码:
Dim Dir as string="C:\test\REG33006\2017-03-09(1)"
Dim patt As String
下一个代码中有三个块,我想过滤不带0x100的块;正如代码所示,我想得到块B,它有3个三段,没有0x100
ss=re.compile(“/begin\s+(.*(?!0x100)。*?)/end”,re.s),但它失败了
内容=“”
/开始
第A1节
section A2
0x100
/结束
/开始
第B1节
section B2
section B3
/结束
/开始
第C1节
section C2
0x100
/结束
'''
ss=re.compile(“/begin\s+(.(!
我不太擅长编写批处理文件,但我有一个文件夹,在这个文件夹中有几个具有特定名称约定的文件:
文件夹为c:\export\u data\
并包含名为
WE_2153886002_20160307.pdf
WE_2158667003_20170503.pdf
现在我将在文件夹C:\data中生成一个名为NC_DOC.DAT的输出文件\
这应该是
UI;19;0001;2153886002;;;;;;c:\export_data\WE_2153886002_20160307.pdf;WE_2153886
我在一个文件夹里有几个文件。我必须使用正则表达式模式匹配文件名。在正则表达式模式中,我有一个单词,它将是一个变量。我希望所有与该模式匹配的文件都被移动到一个单独的目录中,用一个替代文件名替换我匹配的字符串
例如
我有很多文件名在目录中有foo这个词,比如
gadgeagfooafsa
fsafsaffooarwf
fasfsfoofsafff
我必须列出这些文件,并将其复制到另一个目录中,以替换其中的单词foo。我已经将新模式指定为“kuh”,就像上面的文件应该复制到新文件夹一样
gadgea
非常快速和简单的问题
考虑字符串的向量(“AvAv”,“avavavav”)
为什么模式(Av)\1([^A]|$)与两个字符串都匹配
该模式表示有一个“Av”的存在,有另一个,然后或者有一个不是“a”的字符,或者结束。第一个字符串明显匹配,后一个我看不出它是如何匹配的。它有两个“Av”的副本,但是它没有结束(缺少第二个间断),并且后面没有“a”以外的字符(缺少第一个间断),那么模式如何成功地匹配它呢
非常感谢您的时间和帮助。非常感谢。以下是一个解释:
AvAv - matches (Av
我每天晚上都在处理一个大目录。它每晚累积大约100万个文件,其中一半是.txt文件,我需要根据它们的内容移动到不同的目录
每个.txt文件都以管道分隔,只包含20条记录。记录6包含确定将文件移动到哪个目录所需的信息
示例记录:
A|CHNL_ID|4
在这种情况下,文件将移动到/out/4
此脚本正在以每小时80000个文件的速度处理
有没有关于我如何加快速度的建议
opendir(DIR, $dir) or die "$!\n";
while ( defined( my $txtFile =
我的正则表达式知识非常有限,但我正在尝试编写/查找一个表达式,该表达式将捕获文档中的以下字符串类型:
不匹配:
ADY123
AD12ADY
1HGER_2
145-DE-FR2
自行车1
2双环
128D
128878P
不匹配:
自行车
183-329-193
3123123
这样的表达可能吗?基本上,它应该找到任何包含字母和数字的字符串,无论该字符串包含破折号还是下划线。我可以使用以下两个正则表达式找到前两个:
/([A-Z][0-9])\w+/g
/([0-9][A-Z)\w+
我正在使用Matlab中的函数将模式的几个实例替换为单元格数组中的值列表。其思想是用第一个值替换第一个匹配,用下一个值替换第二个匹配,依此类推。因此,每个匹配项都替换为单元格数组中的不同值
我从报纸上读到:
如果replace是由N个字符向量组成的单元格数组,而expression是单个字符向量,则regexprep尝试N个匹配和替换
下面是我的一个任务示例(在这个示例中,假设我知道只有4个匹配项):
结果是:
new_str =
'111 s;dlf kudnbv. soergi; 1
我正在尝试设置重写规则以完成以下任务:
/base/{first}->/base/search/{first}
/base/{first}/{second}->/base/search/{first}/{second}
当然,/base/search/{first}不应该重定向到/base/search/search/{first}
{first}和{second}是带有字母字符和破折号(无数字)的字符串的占位符
但是,我不想像下面这样重写URL:
/base/{first}/{secon
这是我的字符串模式,“动作”是我的模式。表达式应返回模式下一行中的3个参数:
模式如下:
ACTION QUANTITY USOC DESCRIPTION
Impact 1 E8PAM /FIN QC
表达式应返回$1=Impact、$2=1、$3=USOC、$4=/FIN QC
这是我
我尝试使用正则表达式从包含多个换行符的文本响应中提取文本
示例文本:
<td class="comment-text">
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim venia
我正在编写elasticsearch(V1.7)查询来查找所有不以http开头的URL。但是我的映射结果是空的(当然我的URL肯定不是以http开头的)。你能帮我修一下吗
"query": {
"regexp":{
"url": {
"value": "@&~(http.+)",
"flags" : "ANYSTRING"
}
}
}
一旦删除标志,您的查询就会工作:
"query": {
"regexp":{
"url":
我被一个正则表达式函数卡住了。开发它到目前为止非常有趣,但我似乎无法进一步改进它,甚至使用其他在线示例
我有下面的正则表达式函数,我用它来检测16位的卡号
(?我会将整个正则表达式简化为\s((\d{4}[\s-]){3}\d{4})\s
不同的是,我要求3组4位数字加上可选的分隔符,然后是另一组4位数字。这样,我肯定总是16位。\s有助于界定候选人,您可能不需要它
在上测试您可以使用的
(?<!\d)\d{16}(?!\d)|(?<!\d[ _-])(?<!\d)\d{4}(
我试图使用正则表达式来提取句子中出现的标题大小写短语和单词
迄今为止的努力:
(?:[A-Z][a-z]+\s?)+
当这个正则表达式代码应用于下面的示例句子时,会发现那些显示为粗体的单词。但我需要忽略像这样的词和是否(句子开头)
示例句子:
这是一个示例语句,用于检查此代码的实际值它是否有效取决于结果
期望值:
这是一个示例语句,用于检查此代码的实际值。它是否有效取决于结果
有用代码:
import regex as re
text='This is a Sample Sentence
我试图在Google工作表中为条件格式编写一个自定义公式,如果列a中的一个单元格包含单元格C1中逗号删除列表中的一个单词,它将高亮显示
我得到的最接近的结果是:
=SUMPRODUCT(--isnumber(search(split($C$1, ",", true, true), A:A)))=counta(split($C$1, ",", true, true))
返回“True”,但我不太清楚如何适应条件格式语法
我也尝试过,但是查询语法不喜欢“,”
标签: Regex
ocruipathuipath-studiopdf-extraction
我使用UiPath Studio的OCR从PDF中提取了以下文本。由于它是同一PDF页面的原件、副本和三份副本,因此同一文本块重复了3次
Os bens/serviços foram colocados à disposição do adquirente em 2020-04-16 * Data/Hora início de transporte: 2020-04-16 às 11:52
Total Líquido 500,00
Total de Desconto
1 2 3 4 5 6 ...
下一页 最后一页 共 1012 页